<var id="fnfpo"><source id="fnfpo"></source></var>
<rp id="fnfpo"></rp>

<em id="fnfpo"><object id="fnfpo"><input id="fnfpo"></input></object></em>
<em id="fnfpo"><acronym id="fnfpo"></acronym></em>
  • <th id="fnfpo"><track id="fnfpo"></track></th>
  • <progress id="fnfpo"><track id="fnfpo"></track></progress>
  • <tbody id="fnfpo"><pre id="fnfpo"></pre></tbody>

  • x
    x

    在TM1300上實現H.26L的4x4點整數變換

    發布時間:2010-12-12 22:47    發布者:designer
    關鍵詞: 4x4 , TM1300 , 整數變換
    H.26L是下一代視頻編碼標準。它的編碼性超越了所有現存標準,包括H.263+和MPEG-4(SP)。該文分析H.26L引入的多種新的編碼特性,著重講述4%26;#215;4點整數變換,并提出一種在TM1300上實現的快速變換算法。

    H.26L是下一代視頻編碼標準。最初,H.26L由ITU-T的VCEG小組開始著手制訂。2001年11月,MPEG和VCEG聯合成立JVT小組共同參與制訂H.26L。也正因為MPEG的加入,H.26L將被納入MPEG-4的第十部分。由于H.26L標準還在制訂過程中,本文暫時以JVT提供的測試模型TML8為參考。  

    H.26L信源編碼的基本編碼框架類似于當前流行的視頻編碼標準,采用結合變換編碼和預測編碼的混合編碼技術。它出色的性能主要來源于引入的新編碼特性:4%26;#215;4點整數變換、使用UVLC進行熵編碼、1/4~1/8像素精度的運行矢量、有多種塊大小進行運動估計等等。這些新的編碼技術從不同側面提高了壓縮性能和容錯性能。尤其是4%26;#215;4點整數變換,是所有視頻壓縮協議中獨一無二的。  

    雖然H.26L標準還在制訂中,但是在初步的測試中,它的編碼性能超越了現存所有標準,包括H.263+和MPEG-4(Simple profile)。這些試驗結果表明,在取得相同的客觀視頻質量下,H.26L比H.263+能夠節省20%~50%的碼率,比MPEG-4(SP)節省多達50%的碼率。作為下一代視頻編碼標準,H.26L展示了其巨大的發展前景。  

    1 H.26L的4x4點整數變換  

    1.1 變換簡介  

    在H.26L編碼技術中,4x4點整數變換可以看作是DCT變換的整數版本,主要完成去除圖像的空間相關性,與4%26;#215;4點DCT變換有著相同的性質。先考慮一維的整數變換:設a,b,c,d是4個待變換的點,A,B,C,D是對應的4個變換系數,則可以用以下公式表示a,b,c,d點的正變換:  

    A=13a+13b+13c+13d  
    B=17a+7b-7c-17d  
    C=13a-13b-13c+13d  
    D=7a-17b+17c-7d  

    反變換公式如下:  
    a"=13A+17B+13C+7D  
    b"=13A+7B-13C-17D  
    c"=13A-7B-13C+17D  
    d"=13A-17B+13C-7D  

    其中a和a"的關系是a"=676a。也就是說,經過反變換后,還需要進行歸一化操作,使得正變換和變換尺度一致。  
    同樣二維的4x4整數變換的變換核是可分離的。分離的變換將計算復雜度從O(N4)降到O(N3)。  

    1.2 與8x8點DCT變換的比較  

    與傳統的DCT變換相比,H.26L采用4x4點整數變換為視頻編碼帶來了以下優點:  

    ①有助于減少塊斑和環形斑,提高了圖像質量。由于對變換系數進行了量化,造成了高頻系數丟失,所以恢復的圖像中會有塊班和環形班。在H.26L中,采用了更小的4x4點變換,可以有效抑制塊斑和環形斑。  

    ②整數變換減小了積累誤差。傳統的積累誤差來自兩個方面:正變換和反變換不匹配造成的誤與量化造成的誤差。為了達到壓縮的目的,第二種誤差不可避免。但是,由于H.26L采用了精確的整數變換,所以正變換和反變換不會產生誤差,這樣有效地減少了積累誤差。  

    ③運算速度快。因為H.26L采用的變換公式是一個簡單的整數方程,也就是說計算都是基于整數的,而不是浮點數,所以它減少了單個變換的計算量,也有利于采用定點的DSP實現。  

    2 在TM1300中的實現  

    TM1300是一款32位超高性能的多媒體處理器。它的核心處理器采用的是VLIW超長指令字結構,可以在每一個時鐘周期內同時進行5個操作;支持高度并行的定制操作,能大大加快數字信號處理和多媒體應用中常見的特殊運行的性能,而定制操作在使用上類似于C語言函數調用,方便了程序的設計。  

    本文針對4x4點整數變換的特點和TM1300的定制運算指令的特點,對整數變換作了以下調整:先做行變換,再做列變換。由于行變換的結果不會超過16位的表示范圍,故在作列變換之前,重新合并數據,再作列變換,這樣作是基于以下兩點考慮。  

    第一,由于視頻輸入數據為無符號的字節型,而TM1300是32位的處理器,以字為單位訪問內存,能提高訪問的效率。當前4x4數據塊(指針為P1)和參考幀4%26;#215;4數據塊(指針為P2)的數據組織如下。待變換的點為當前數據塊的值與參考幀數據塊對應的值之差。  

    P1:cal,cb1,cc1,cd1 P2:ra1,rb1,rc1,rd1  
    ca2,cb2,cc2,cd2 ra2,rb2,rc2,rd2  
    ca3,cb3,cc3,cd3 ra3,rb3,rc3,rd3  
    ca4,cb4,cc4,cd4 ra4,rb4,rc4,rd4  

    第二,可以利用8位乘/累加的定制操作,一個操作能完成4個8位乘/累加,一個機器周期(CLK)最多能執行5個操作。與非定制的乘/累加相比,減少了運算的次數,提高了程序運行的并行度。





    圖1為ifir8ui定制操作功能示意圖。  

    3 實驗結果  

    本文提出的基于TM1300的4x4整數變換的快速算法,使用了并行算是技術大大減少了計算量。實驗表明,進行1個4x4點整數變換,直接用乘法和加法運算需要80個機器周期,改進后的算法只需28個機器周期;而利用TM1300進行1個8x8點定點DCT變換需要180個機器周期,也明顯大于4個4x4點整數變換時間。在變換方面H.264的變換編碼運算復雜度小于其它編碼方法。
    本文地址:http://www.portaltwn.com/thread-46138-1-1.html     【打印本頁】

    本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
    您需要登錄后才可以發表評論 登錄 | 立即注冊

    廠商推薦

    • Microchip視頻專區
    • EtherCAT®和Microchip LAN925x從站控制器介紹培訓教程
    • MPLAB®模擬設計器——在線電源解決方案,加速設計
    • 讓您的模擬設計靈感,化為觸手可及的現實
    • 深度體驗Microchip自動輔助駕駛應用方案——2025巡展開啟報名!
    • 貿澤電子(Mouser)專區
    關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
    電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
    快速回復 返回頂部 返回列表
    精品一区二区三区自拍图片区_国产成人亚洲精品_亚洲Va欧美va国产综合888_久久亚洲国产精品五月天婷