日韩视频专区_久久精品国产成人av_青青免费在线视频_欧美精品一级片_日韩在线观看中文字幕_九九热在线精品

美章網(wǎng) 資料文庫 高效低存儲(chǔ)DWT的結(jié)構(gòu)設(shè)計(jì)范文

高效低存儲(chǔ)DWT的結(jié)構(gòu)設(shè)計(jì)范文

本站小編為你精心準(zhǔn)備了高效低存儲(chǔ)DWT的結(jié)構(gòu)設(shè)計(jì)參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

高效低存儲(chǔ)DWT的結(jié)構(gòu)設(shè)計(jì)

《西安電子科技大學(xué)學(xué)報(bào)》2016年第二期

1DWT的原理及分析

1.1DWT提升結(jié)構(gòu)原理相比于傳統(tǒng)的卷積結(jié)構(gòu),DWT提升結(jié)構(gòu)在內(nèi)存利用率和讀取次數(shù)上都具有優(yōu)勢(shì)。提升小波的原理是將多相位小波濾波矩陣分解為兩個(gè)連續(xù)的上三角和下三角矩陣以及一個(gè)對(duì)角矩陣。CCSDS-IDC采用的基于提升的9/7DWT,其具體實(shí)現(xiàn)方式如公式(2)所示。在公式(2)中,x(n)為輸入的圖像數(shù)據(jù),y(n)表示按交織方式存放的小波系數(shù),其中y(2n)為低通系數(shù),y(2n+1)為高通系數(shù),常系數(shù)1.586,0.053,0.883,0.444,K1.149。圖像的DWT行變換與列變換都需要完成與公式(2)相同的運(yùn)算過程,行變換之后的結(jié)果再經(jīng)過列變換才能完成一級(jí)DWT,一級(jí)DWT之后可以得到HH、HL、LH和LL共四個(gè)小波子帶,選擇其中的LL子帶進(jìn)行下一級(jí)DWT處理。依此方式,經(jīng)過三級(jí)DWT可以得到10個(gè)子帶,分別為三級(jí)輸出的HH,HL,LH等9個(gè)子帶以及第三級(jí)輸出的LL3子帶。10個(gè)子帶的小波系數(shù)按照分層樹的結(jié)構(gòu)形式組織成獨(dú)立的單元塊,每個(gè)單元塊中包含64個(gè)小波系數(shù),包括1個(gè)DC系數(shù)(LL3子帶)和63個(gè)AC系數(shù)(來自其余9個(gè)子帶)。

1.2DWT多級(jí)變換的原理分析

DWT的第一級(jí)變換是對(duì)原始圖像進(jìn)行處理,而第二級(jí)變換是對(duì)第一級(jí)變換后得到的LL1子帶進(jìn)行處理,LL1子帶的寬度和高度分別是原始圖像寬度和高度的1/2,其分辨率大小是原始圖像的1/4。對(duì)于分辨率為NN的圖像來說,若采用行列并行結(jié)構(gòu),那么完成第一級(jí)DWT需要近2N個(gè)時(shí)鐘,而對(duì)于第二三級(jí)DWT來說,其需要消耗的處理時(shí)間分別約為2N/4和2N/16個(gè)時(shí)鐘。顯然,第二三級(jí)所需要的處理時(shí)間之和小于第一級(jí)所需的時(shí)間,即222N/4+N/16<N。由此可知,從處理時(shí)間上看,將第二三級(jí)DWT可以分時(shí)復(fù)用同一個(gè)DWT模塊,并可以與第一級(jí)DWT并行處理。實(shí)際上,由等比數(shù)列的求和公式可知,第二級(jí)及以上級(jí)的DWT所消耗的處理時(shí)間總和永遠(yuǎn)不會(huì)超過2N個(gè)時(shí)鐘,即永遠(yuǎn)不會(huì)超過第一級(jí)DWT消耗的時(shí)間,所以第二級(jí)及以上級(jí)二維DWT都可以時(shí)分復(fù)用同一個(gè)變換模塊。基于此分析,本文設(shè)計(jì)了第二三級(jí)DWT時(shí)分復(fù)用變換模塊的VLSI結(jié)構(gòu),該結(jié)構(gòu)具有良好的擴(kuò)展性,只需要簡(jiǎn)單的控制參數(shù)修改便可適用于變換等級(jí)為二級(jí)以上的任意多級(jí)小波變換,也可應(yīng)用于與9/7DWT形式類似的5/3DWT。

2多級(jí)復(fù)用高速DWT的VLSI結(jié)構(gòu)

2.1乘加器復(fù)用的DWT單步提升結(jié)構(gòu)對(duì)于DWT的提升結(jié)構(gòu)來說,其各步提升均可采用同一種單步提升結(jié)構(gòu)。這一點(diǎn)從公式(2)所示的四步提升公式也可以看出,即各步提升的計(jì)算過程近似相同,均含有兩次加法和一次乘法運(yùn)算。其區(qū)別僅是各步輸入的乘法系數(shù)互不相同。第一步提升過程的計(jì)算公式如公式(3)所示:通過簡(jiǎn)單變形,可以看出該提升過程可以分為公式(4)所示的兩次計(jì)算,通過采用兩次計(jì)算方式,可以將乘法器和加法器進(jìn)行時(shí)分復(fù)用,通過選擇控制的方式由同一電路結(jié)構(gòu)完成兩次計(jì)算。基于以上分析,我們?cè)O(shè)計(jì)了如圖2(a)所示的電路結(jié)構(gòu),該結(jié)構(gòu)由5個(gè)選擇器、1個(gè)移位器、1個(gè)乘法器、1個(gè)加法器和1個(gè)寄存器構(gòu)成。當(dāng)兩個(gè)數(shù)據(jù)到來時(shí),該結(jié)構(gòu)開始進(jìn)行運(yùn)算,將運(yùn)算的中間結(jié)果k1存入圖2(a)所示的寄存器中。在此結(jié)構(gòu)中,對(duì)需要進(jìn)行邊界拓展的數(shù)據(jù)進(jìn)行左移一位的操作。圖2(a)所示的DWT單步提升結(jié)構(gòu)可劃分為兩個(gè)組成部分,即存儲(chǔ)和運(yùn)算部分,其中的運(yùn)算部分是虛線標(biāo)注的運(yùn)算處理單元(ProcessingElement,PE)。對(duì)于行變換和列變換來說,它們的PE結(jié)構(gòu)相同,只是所用的存儲(chǔ)結(jié)構(gòu)不同。行變換使用D觸發(fā)器存儲(chǔ)數(shù)據(jù),而列變換使用雙端口隨機(jī)存取存儲(chǔ)器(RandomAccessMemory,RAM)存儲(chǔ)數(shù)據(jù)。在XilinxVirtex4之后的FPGA型號(hào)系列中,內(nèi)嵌有DSP48的IP(IntellectualProperty)硬核可以實(shí)現(xiàn)乘加運(yùn)算,具有更高的速度性能、更低的功耗和更佳的資源開銷,用其代替圖2(a)中的乘法器和加法器,可以得到速度更快、面積更小的PE硬件結(jié)構(gòu),如圖2(b)所示。

2.2行變換電路結(jié)構(gòu)9/7dwt的4步提升計(jì)算均可使用相同的單步提升PE結(jié)構(gòu)來完成,僅僅是輸入數(shù)據(jù)和提升常系數(shù)不同。為了提高4步提升的計(jì)算速度,我們通過將4個(gè)獨(dú)立的單步提升PE結(jié)構(gòu)級(jí)聯(lián)起來并行計(jì)算,便可實(shí)時(shí)地實(shí)現(xiàn)一次行變換,如圖3(a)所示。由圖2(b)可知,數(shù)據(jù)輸入到數(shù)據(jù)輸出之間存在較長(zhǎng)的存組合邏輯路徑,如果將兩個(gè)PE直接級(jí)聯(lián)將形成一塊路徑更長(zhǎng)的組合邏輯,這會(huì)導(dǎo)致組合邏輯時(shí)延變大,降低系統(tǒng)的最大時(shí)鐘頻率。為了避免該問題,我們?cè)趫D3(a)所示的行變換結(jié)構(gòu)中加入了流水線(Pipeline)設(shè)計(jì),通過插入D觸發(fā)器來縮短組合邏輯路徑,即在PE之間使用D觸發(fā)器進(jìn)行連接。圖3(a)中的奇偶標(biāo)識(shí)信號(hào)將輸入數(shù)據(jù)區(qū)分成兩部分,分別為偶數(shù)位置數(shù)據(jù)x(2n)和奇數(shù)位置數(shù)據(jù)x(2n+1)。第一步提升輸出偶數(shù)位置的數(shù)據(jù)仍為x(2n),而奇數(shù)位置的數(shù)據(jù)是y(2n+1)。當(dāng)輸入第一行第1個(gè)數(shù)據(jù)s時(shí),數(shù)據(jù)存入第一個(gè)PE左端的寄存器中。輸入第2個(gè)數(shù)據(jù)d時(shí),讀取上次存入寄存器中的數(shù)據(jù)s,用s與d做運(yùn)算得到第一步提升的中間結(jié)果inv,再將inv重新存回該寄存器中,同時(shí),行變換的第二步提升啟動(dòng),將s寫入第二個(gè)PE左端的寄存器中。以此方式按行進(jìn)行小波變換。

2.3列變換電路結(jié)構(gòu)行變換結(jié)果經(jīng)過兩個(gè)寄存器進(jìn)入列變換模塊,為了實(shí)現(xiàn)行列并行運(yùn)算,列變換需要對(duì)整行數(shù)據(jù)進(jìn)行操作,因此,輸入數(shù)據(jù)的緩存和中間結(jié)果的緩存不能使用寄存器存儲(chǔ),而需要使用雙端口RAM存儲(chǔ)整行數(shù)據(jù)。當(dāng)輸入第二行第一個(gè)數(shù)據(jù)時(shí)開始進(jìn)行列變換,因此,RAM只需要緩存一行數(shù)據(jù)。列變換結(jié)構(gòu)如圖3(b)所示,對(duì)于第二級(jí)及以上級(jí)DWT,RAM需要緩存各級(jí)的中間結(jié)果,因此需要標(biāo)記各級(jí)DWT的起始地址。

2.4多級(jí)復(fù)用DWT及小波系數(shù)緩存處理電路結(jié)構(gòu)行變換結(jié)構(gòu)與列變換結(jié)構(gòu)級(jí)聯(lián)實(shí)現(xiàn)一級(jí)DWT。由1.2節(jié)分析可知,高級(jí)別DWT可時(shí)分復(fù)用同一個(gè)DWT模塊來實(shí)現(xiàn),該時(shí)分復(fù)用方法會(huì)增加一些控制模塊的邏輯資源,相比于一級(jí)DWT來說,所增加的邏輯資源是非常少的。復(fù)用控制模塊功能主要包括產(chǎn)生奇偶標(biāo)識(shí)信號(hào)、級(jí)別標(biāo)識(shí)信號(hào)和RAM控制信號(hào)。因?yàn)楦呒?jí)別DWT會(huì)共用相同的數(shù)據(jù)線,所以需要一個(gè)級(jí)別標(biāo)識(shí)信號(hào)來表明當(dāng)前進(jìn)行的DWT級(jí)別。本文所實(shí)現(xiàn)的多級(jí)DWT復(fù)用結(jié)構(gòu),通過簡(jiǎn)單的參數(shù)修改,便可應(yīng)用于變換等級(jí)為二級(jí)以上的任意多級(jí)小波變換。根據(jù)分塊比特平面熵編碼的特點(diǎn),當(dāng)LL3數(shù)據(jù)到來時(shí)即可開始進(jìn)行熵編碼。換句話說,緩存少量的小波系數(shù)便可將其按特定順序輸出給熵編碼器進(jìn)行處理,而不需要等到所有小波系數(shù)都得到之后才開始熵編碼。因此,本文將DWT與熵編碼之間的緩存使用片內(nèi)雙端口RAM來實(shí)現(xiàn),而不用片外DRAM存儲(chǔ)器,這樣可以節(jié)省大量的片外存儲(chǔ)資源。由于使用RAM需要額外的控制邏輯,RAM的個(gè)數(shù)應(yīng)該盡量少。本文將各級(jí)輸出的LH和HH分量合并到一起,從而減少RAM的個(gè)數(shù),因此本文共用了3個(gè)雙端口RAM(如圖4所示的RAM5,RAM6,RAM7)來緩存DWT最終得到的小波系數(shù),并在條件滿足時(shí)及時(shí)地將這些小波系數(shù)輸出給后級(jí)熵編碼器進(jìn)行處理。我們將RAM5劃分為六塊存儲(chǔ)區(qū)域,分別存儲(chǔ)各級(jí)輸出的HH和LH子帶數(shù)據(jù),將RAM6劃分為三塊存儲(chǔ)區(qū)域,存儲(chǔ)各級(jí)輸出的HL子帶數(shù)據(jù),而RAM7只存儲(chǔ)第三級(jí)輸出的LL3子帶數(shù)據(jù)。小波系數(shù)緩存處理結(jié)構(gòu)如圖4所示,通過子帶分離器將輸出的小波系數(shù)分離,并乘以相應(yīng)的K系數(shù)。通過寫控制器將數(shù)據(jù)寫入對(duì)應(yīng)的存儲(chǔ)器中,并且三個(gè)RAM寫入數(shù)據(jù)時(shí)的地址變化由同一份邏輯產(chǎn)生,可以進(jìn)一步節(jié)約邏輯資源。讀控制器根據(jù)LL3同步信號(hào)判斷讀取的起始時(shí)間,三個(gè)存儲(chǔ)器的讀取結(jié)果進(jìn)行或運(yùn)算作為進(jìn)入熵編碼器的輸入數(shù)據(jù),其同步信號(hào)是通過將各個(gè)存儲(chǔ)器讀使能信號(hào)相或運(yùn)算并延遲一個(gè)時(shí)鐘得到的。

3性能與仿真

將本文提出的9/7DWT提升結(jié)構(gòu)與其他文獻(xiàn)所提出的結(jié)構(gòu)進(jìn)行對(duì)比,在邏輯規(guī)模和計(jì)算時(shí)間等方面的對(duì)比結(jié)果如表1所示。其中Tm和Ta分別代表乘法器和加法器時(shí)延,圖像的分辨率為N*N。由表1可以看出,本文結(jié)構(gòu)所需存儲(chǔ)器、加法器和乘法器都相對(duì)較少,關(guān)鍵路徑也很短。相對(duì)于乘法器和加法器使用較少的文獻(xiàn)[11]-[13]來說,其輸出時(shí)延也是最短的。

實(shí)驗(yàn)結(jié)果本文所提出的VLSI結(jié)構(gòu)在Xilinx型號(hào)為XC4VSX55的FPGA中得到了硬件實(shí)現(xiàn),具有95.91MPixels/s的數(shù)據(jù)處理性能。表2為本文與其它文獻(xiàn)slices資源的對(duì)比情況,由表2可以看出,本文在分辨率、位寬和級(jí)數(shù)等指標(biāo)都較大的情況下,消耗FPGA的slices資源最少,且不需要片外緩存。由此可見,本文結(jié)構(gòu)有明顯的資源優(yōu)勢(shì)。

4結(jié)束語

本文通過DWT提升結(jié)構(gòu)復(fù)用和級(jí)間復(fù)用,在保證數(shù)據(jù)處理速度的同時(shí)減少了邏輯資源的使用。此外,根據(jù)分塊比特平面熵編碼的特點(diǎn),我們改變了傳統(tǒng)的DWT輸出數(shù)據(jù)緩存處理方式,將輸出數(shù)據(jù)所需的片外存儲(chǔ)資源用片內(nèi)少量RAM緩存替換,在不降低處理速度的情況下,節(jié)省了片外存儲(chǔ),減少了系統(tǒng)體積和功耗,非常適合空間環(huán)境下圖像數(shù)據(jù)高速處理的應(yīng)用需求。

作者:董明巖 雷杰 王柯儼 李云松 單位:西安電子科技大學(xué)綜合業(yè)務(wù)網(wǎng)國(guó)家重點(diǎn)實(shí)驗(yàn)室

主站蜘蛛池模板: 国产片久久 | 中韩毛片| 欧美特黄一级 | 久久机热这里只有精品 | 99国内精品| 久久精品视频在线观看 | 97国产在线 | 欧美一区二区久久 | 国产传媒在线 | 亚洲精品视频在线播放 | 一区二区三区视频免费在线观看 | 中文字幕精品视频 | 一级中国毛片 | 日本在线播放一区 | 在线激情av | 国产黄色免费 | 毛片网站在线播放 | 美国一级片在线观看 | 午夜久久久久久久久久久 | 毛片999 | 精品久草| 日韩三级一区二区三区 | 国产夫妻露脸 | 精品国产一区在线观看 | 青青操视频在线播放 | 高清乱码免费看污 | 超碰资源在线 | 日韩激情在线 | 中文字幕avav | 午夜精品免费观看 | 午夜视频免费观看 | 午夜成年 | 中文字幕在线免费视频 | 精品成人一区 | 亚洲免费在线 | 在线免费成人网 | 日本黄在线观看 | 亚色视频在线观看 | 香蕉视频一直看一直爽 | 五月天狠狠操 | 色网站免费 |