色小视频,色女人av,男人的天堂毛片

本站小編為你精心準(zhǔn)備了高效低存儲(chǔ)DWT的結(jié)構(gòu)設(shè)計(jì)參考范文，愿這些范文能點(diǎn)燃您思維的火花，激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

高效低存儲(chǔ)DWT的結(jié)構(gòu)設(shè)計(jì)

《西安電子科技大學(xué)學(xué)報(bào)》2016年第二期

1DWT的原理及分析

1.1DWT提升結(jié)構(gòu)原理相比于傳統(tǒng)的卷積結(jié)構(gòu)，DWT提升結(jié)構(gòu)在內(nèi)存利用率和讀取次數(shù)上都具有優(yōu)勢(shì)。提升小波的原理是將多相位小波濾波矩陣分解為兩個(gè)連續(xù)的上三角和下三角矩陣以及一個(gè)對(duì)角矩陣。CCSDS-IDC采用的基于提升的9/7DWT，其具體實(shí)現(xiàn)方式如公式(2)所示。在公式(2)中，x(n)為輸入的圖像數(shù)據(jù)，y(n)表示按交織方式存放的小波系數(shù)，其中y(2n)為低通系數(shù)，y(2n+1)為高通系數(shù)，常系數(shù)1.586，0.053，0.883，0.444，K1.149。圖像的DWT行變換與列變換都需要完成與公式(2)相同的運(yùn)算過程，行變換之后的結(jié)果再經(jīng)過列變換才能完成一級(jí)DWT，一級(jí)DWT之后可以得到HH、HL、LH和LL共四個(gè)小波子帶，選擇其中的LL子帶進(jìn)行下一級(jí)DWT處理。依此方式，經(jīng)過三級(jí)DWT可以得到10個(gè)子帶，分別為三級(jí)輸出的HH，HL,LH等9個(gè)子帶以及第三級(jí)輸出的LL3子帶。10個(gè)子帶的小波系數(shù)按照分層樹的結(jié)構(gòu)形式組織成獨(dú)立的單元塊，每個(gè)單元塊中包含64個(gè)小波系數(shù)，包括1個(gè)DC系數(shù)(LL3子帶)和63個(gè)AC系數(shù)(來自其余9個(gè)子帶)。

1.2DWT多級(jí)變換的原理分析

DWT的第一級(jí)變換是對(duì)原始圖像進(jìn)行處理，而第二級(jí)變換是對(duì)第一級(jí)變換后得到的LL1子帶進(jìn)行處理，LL1子帶的寬度和高度分別是原始圖像寬度和高度的1/2，其分辨率大小是原始圖像的1/4。對(duì)于分辨率為NN的圖像來說，若采用行列并行結(jié)構(gòu)，那么完成第一級(jí)DWT需要近2N個(gè)時(shí)鐘，而對(duì)于第二三級(jí)DWT來說，其需要消耗的處理時(shí)間分別約為2N/4和2N/16個(gè)時(shí)鐘。顯然，第二三級(jí)所需要的處理時(shí)間之和小于第一級(jí)所需的時(shí)間，即222N/4+N/16<N。由此可知，從處理時(shí)間上看，將第二三級(jí)DWT可以分時(shí)復(fù)用同一個(gè)DWT模塊，并可以與第一級(jí)DWT并行處理。實(shí)際上，由等比數(shù)列的求和公式可知，第二級(jí)及以上級(jí)的DWT所消耗的處理時(shí)間總和永遠(yuǎn)不會(huì)超過2N個(gè)時(shí)鐘，即永遠(yuǎn)不會(huì)超過第一級(jí)DWT消耗的時(shí)間，所以第二級(jí)及以上級(jí)二維DWT都可以時(shí)分復(fù)用同一個(gè)變換模塊。基于此分析，本文設(shè)計(jì)了第二三級(jí)DWT時(shí)分復(fù)用變換模塊的VLSI結(jié)構(gòu)，該結(jié)構(gòu)具有良好的擴(kuò)展性，只需要簡(jiǎn)單的控制參數(shù)修改便可適用于變換等級(jí)為二級(jí)以上的任意多級(jí)小波變換，也可應(yīng)用于與9/7DWT形式類似的5/3DWT。

2多級(jí)復(fù)用高速DWT的VLSI結(jié)構(gòu)

2.1乘加器復(fù)用的DWT單步提升結(jié)構(gòu)對(duì)于DWT的提升結(jié)構(gòu)來說，其各步提升均可采用同一種單步提升結(jié)構(gòu)。這一點(diǎn)從公式(2)所示的四步提升公式也可以看出，即各步提升的計(jì)算過程近似相同，均含有兩次加法和一次乘法運(yùn)算。其區(qū)別僅是各步輸入的乘法系數(shù)互不相同。第一步提升過程的計(jì)算公式如公式(3)所示：通過簡(jiǎn)單變形，可以看出該提升過程可以分為公式(4)所示的兩次計(jì)算，通過采用兩次計(jì)算方式，可以將乘法器和加法器進(jìn)行時(shí)分復(fù)用，通過選擇控制的方式由同一電路結(jié)構(gòu)完成兩次計(jì)算。基于以上分析，我們?cè)O(shè)計(jì)了如圖2(a)所示的電路結(jié)構(gòu)，該結(jié)構(gòu)由5個(gè)選擇器、1個(gè)移位器、1個(gè)乘法器、1個(gè)加法器和1個(gè)寄存器構(gòu)成。當(dāng)兩個(gè)數(shù)據(jù)到來時(shí)，該結(jié)構(gòu)開始進(jìn)行運(yùn)算，將運(yùn)算的中間結(jié)果k1存入圖2(a)所示的寄存器中。在此結(jié)構(gòu)中，對(duì)需要進(jìn)行邊界拓展的數(shù)據(jù)進(jìn)行左移一位的操作。圖2(a)所示的DWT單步提升結(jié)構(gòu)可劃分為兩個(gè)組成部分，即存儲(chǔ)和運(yùn)算部分，其中的運(yùn)算部分是虛線標(biāo)注的運(yùn)算處理單元（ProcessingElement，PE）。對(duì)于行變換和列變換來說，它們的PE結(jié)構(gòu)相同，只是所用的存儲(chǔ)結(jié)構(gòu)不同。行變換使用D觸發(fā)器存儲(chǔ)數(shù)據(jù)，而列變換使用雙端口隨機(jī)存取存儲(chǔ)器（RandomAccessMemory,RAM）存儲(chǔ)數(shù)據(jù)。在XilinxVirtex4之后的FPGA型號(hào)系列中，內(nèi)嵌有DSP48的IP(IntellectualProperty)硬核可以實(shí)現(xiàn)乘加運(yùn)算，具有更高的速度性能、更低的功耗和更佳的資源開銷，用其代替圖2(a)中的乘法器和加法器，可以得到速度更快、面積更小的PE硬件結(jié)構(gòu)，如圖2(b)所示。

2.2行變換電路結(jié)構(gòu)9/7dwt的4步提升計(jì)算均可使用相同的單步提升PE結(jié)構(gòu)來完成，僅僅是輸入數(shù)據(jù)和提升常系數(shù)不同。為了提高4步提升的計(jì)算速度，我們通過將4個(gè)獨(dú)立的單步提升PE結(jié)構(gòu)級(jí)聯(lián)起來并行計(jì)算，便可實(shí)時(shí)地實(shí)現(xiàn)一次行變換，如圖3(a)所示。由圖2(b)可知，數(shù)據(jù)輸入到數(shù)據(jù)輸出之間存在較長(zhǎng)的存組合邏輯路徑，如果將兩個(gè)PE直接級(jí)聯(lián)將形成一塊路徑更長(zhǎng)的組合邏輯，這會(huì)導(dǎo)致組合邏輯時(shí)延變大，降低系統(tǒng)的最大時(shí)鐘頻率。為了避免該問題，我們?cè)趫D3(a)所示的行變換結(jié)構(gòu)中加入了流水線（Pipeline）設(shè)計(jì)，通過插入D觸發(fā)器來縮短組合邏輯路徑，即在PE之間使用D觸發(fā)器進(jìn)行連接。圖3(a)中的奇偶標(biāo)識(shí)信號(hào)將輸入數(shù)據(jù)區(qū)分成兩部分，分別為偶數(shù)位置數(shù)據(jù)x(2n)和奇數(shù)位置數(shù)據(jù)x(2n+1)。第一步提升輸出偶數(shù)位置的數(shù)據(jù)仍為x(2n),而奇數(shù)位置的數(shù)據(jù)是y(2n+1)。當(dāng)輸入第一行第1個(gè)數(shù)據(jù)s時(shí)，數(shù)據(jù)存入第一個(gè)PE左端的寄存器中。輸入第2個(gè)數(shù)據(jù)d時(shí)，讀取上次存入寄存器中的數(shù)據(jù)s，用s與d做運(yùn)算得到第一步提升的中間結(jié)果inv，再將inv重新存回該寄存器中，同時(shí)，行變換的第二步提升啟動(dòng)，將s寫入第二個(gè)PE左端的寄存器中。以此方式按行進(jìn)行小波變換。

2.3列變換電路結(jié)構(gòu)行變換結(jié)果經(jīng)過兩個(gè)寄存器進(jìn)入列變換模塊，為了實(shí)現(xiàn)行列并行運(yùn)算，列變換需要對(duì)整行數(shù)據(jù)進(jìn)行操作，因此，輸入數(shù)據(jù)的緩存和中間結(jié)果的緩存不能使用寄存器存儲(chǔ)，而需要使用雙端口RAM存儲(chǔ)整行數(shù)據(jù)。當(dāng)輸入第二行第一個(gè)數(shù)據(jù)時(shí)開始進(jìn)行列變換，因此，RAM只需要緩存一行數(shù)據(jù)。列變換結(jié)構(gòu)如圖3(b)所示，對(duì)于第二級(jí)及以上級(jí)DWT，RAM需要緩存各級(jí)的中間結(jié)果，因此需要標(biāo)記各級(jí)DWT的起始地址。

2.4多級(jí)復(fù)用DWT及小波系數(shù)緩存處理電路結(jié)構(gòu)行變換結(jié)構(gòu)與列變換結(jié)構(gòu)級(jí)聯(lián)實(shí)現(xiàn)一級(jí)DWT。由1.2節(jié)分析可知，高級(jí)別DWT可時(shí)分復(fù)用同一個(gè)DWT模塊來實(shí)現(xiàn)，該時(shí)分復(fù)用方法會(huì)增加一些控制模塊的邏輯資源，相比于一級(jí)DWT來說，所增加的邏輯資源是非常少的。復(fù)用控制模塊功能主要包括產(chǎn)生奇偶標(biāo)識(shí)信號(hào)、級(jí)別標(biāo)識(shí)信號(hào)和RAM控制信號(hào)。因?yàn)楦呒?jí)別DWT會(huì)共用相同的數(shù)據(jù)線，所以需要一個(gè)級(jí)別標(biāo)識(shí)信號(hào)來表明當(dāng)前進(jìn)行的DWT級(jí)別。本文所實(shí)現(xiàn)的多級(jí)DWT復(fù)用結(jié)構(gòu)，通過簡(jiǎn)單的參數(shù)修改，便可應(yīng)用于變換等級(jí)為二級(jí)以上的任意多級(jí)小波變換。根據(jù)分塊比特平面熵編碼的特點(diǎn)，當(dāng)LL3數(shù)據(jù)到來時(shí)即可開始進(jìn)行熵編碼。換句話說，緩存少量的小波系數(shù)便可將其按特定順序輸出給熵編碼器進(jìn)行處理，而不需要等到所有小波系數(shù)都得到之后才開始熵編碼。因此，本文將DWT與熵編碼之間的緩存使用片內(nèi)雙端口RAM來實(shí)現(xiàn)，而不用片外DRAM存儲(chǔ)器，這樣可以節(jié)省大量的片外存儲(chǔ)資源。由于使用RAM需要額外的控制邏輯，RAM的個(gè)數(shù)應(yīng)該盡量少。本文將各級(jí)輸出的LH和HH分量合并到一起，從而減少RAM的個(gè)數(shù)，因此本文共用了3個(gè)雙端口RAM(如圖4所示的RAM5，RAM6，RAM7)來緩存DWT最終得到的小波系數(shù)，并在條件滿足時(shí)及時(shí)地將這些小波系數(shù)輸出給后級(jí)熵編碼器進(jìn)行處理。我們將RAM5劃分為六塊存儲(chǔ)區(qū)域，分別存儲(chǔ)各級(jí)輸出的HH和LH子帶數(shù)據(jù)，將RAM6劃分為三塊存儲(chǔ)區(qū)域，存儲(chǔ)各級(jí)輸出的HL子帶數(shù)據(jù)，而RAM7只存儲(chǔ)第三級(jí)輸出的LL3子帶數(shù)據(jù)。小波系數(shù)緩存處理結(jié)構(gòu)如圖4所示，通過子帶分離器將輸出的小波系數(shù)分離，并乘以相應(yīng)的K系數(shù)。通過寫控制器將數(shù)據(jù)寫入對(duì)應(yīng)的存儲(chǔ)器中，并且三個(gè)RAM寫入數(shù)據(jù)時(shí)的地址變化由同一份邏輯產(chǎn)生，可以進(jìn)一步節(jié)約邏輯資源。讀控制器根據(jù)LL3同步信號(hào)判斷讀取的起始時(shí)間，三個(gè)存儲(chǔ)器的讀取結(jié)果進(jìn)行或運(yùn)算作為進(jìn)入熵編碼器的輸入數(shù)據(jù)，其同步信號(hào)是通過將各個(gè)存儲(chǔ)器讀使能信號(hào)相或運(yùn)算并延遲一個(gè)時(shí)鐘得到的。

3性能與仿真

將本文提出的9/7DWT提升結(jié)構(gòu)與其他文獻(xiàn)所提出的結(jié)構(gòu)進(jìn)行對(duì)比，在邏輯規(guī)模和計(jì)算時(shí)間等方面的對(duì)比結(jié)果如表1所示。其中Tm和Ta分別代表乘法器和加法器時(shí)延，圖像的分辨率為N*N。由表1可以看出，本文結(jié)構(gòu)所需存儲(chǔ)器、加法器和乘法器都相對(duì)較少，關(guān)鍵路徑也很短。相對(duì)于乘法器和加法器使用較少的文獻(xiàn)[11]-[13]來說，其輸出時(shí)延也是最短的。

實(shí)驗(yàn)結(jié)果本文所提出的VLSI結(jié)構(gòu)在Xilinx型號(hào)為XC4VSX55的FPGA中得到了硬件實(shí)現(xiàn)，具有95.91MPixels／s的數(shù)據(jù)處理性能。表2為本文與其它文獻(xiàn)slices資源的對(duì)比情況，由表2可以看出，本文在分辨率、位寬和級(jí)數(shù)等指標(biāo)都較大的情況下，消耗FPGA的slices資源最少，且不需要片外緩存。由此可見，本文結(jié)構(gòu)有明顯的資源優(yōu)勢(shì)。

4結(jié)束語

本文通過DWT提升結(jié)構(gòu)復(fù)用和級(jí)間復(fù)用，在保證數(shù)據(jù)處理速度的同時(shí)減少了邏輯資源的使用。此外，根據(jù)分塊比特平面熵編碼的特點(diǎn)，我們改變了傳統(tǒng)的DWT輸出數(shù)據(jù)緩存處理方式，將輸出數(shù)據(jù)所需的片外存儲(chǔ)資源用片內(nèi)少量RAM緩存替換，在不降低處理速度的情況下，節(jié)省了片外存儲(chǔ)，減少了系統(tǒng)體積和功耗，非常適合空間環(huán)境下圖像數(shù)據(jù)高速處理的應(yīng)用需求。

作者：董明巖雷杰王柯儼李云松單位：西安電子科技大學(xué)綜合業(yè)務(wù)網(wǎng)國(guó)家重點(diǎn)實(shí)驗(yàn)室

日韩视频专区_久久精品国产成人av_青青免费在线视频_欧美精品一级片_日韩在线观看中文字幕_九九热在线精品

高效低存儲(chǔ)DWT的結(jié)構(gòu)設(shè)計(jì)范文

擴(kuò)展閱讀

精品推薦