第十一章 影像與視訊壓縮.

Slides:



Advertisements
Similar presentations
歷史二 第一篇 第二章 三代的興衰與文化 第一節 三代興衰與封建體制 第二節 時代劇變與學術教育的發達.
Advertisements

导 游 基 础 知 识.
第二章 数字图像媒体.
传道书 12种虚空 9处不可知 23样价值观 7个小结论 人生是虚空的虚空! (没有神的人生)
第一章 引论.
MPEG Family.
桃園國際機場 通行證規定教育訓練簡報.
3.《增值税纳税申报表(小规模纳税人适用)》填写
〝奇異恩典〞~陳進成 『我的弟兄們,你們落在百般試煉中,都要 以為大喜樂;因知道你們的信心經過試驗, 就生忍耐。但忍耐也當成功,使你們成全、
外国小说话题突破系列之七 情感.
第23课 美术的辉煌 米勒:《拾穗者》(法国).
一般纳税人增值税 纳税申报表填写指引 白银高新区国税局 纳税服务科 2016年5月.
第7课 古罗马的政制与法律.
第二单元 商鞅变法 第1课 改革变法风潮与秦国历史机遇(背景) 第2课 “为秦开帝业”──商鞅变法(内容)
6.1 概述 6.2 信源编码与压缩技术 6.3 信道编码与调制技术
内 容 ● 民间非营利组织会计实务操作 ● 项目会计核算中注意事项 ● 社会组织年检报告的填列 ● 社会组织评估中财务资产指标的解释
荆轲刺秦王 《战国策》.
初探逻辑推理 提高思维水平 ——《逻辑和语文学习》
列王紀下8章 啟示錄12章 書念婦人 婦人 死裡復活的兒子 被提的男孩子 七年饑荒 三年半大災難 非利士地 曠野 歸還房屋田地
佛教既是外來宗教, 為何盛行於中國?.
港澳信義會明道小學 天地有情 分享者:徐燦麗老師、 蘇娟玉老師 日期:2005年12月3日 P.1.
第二章 三代的興衰與文化 第二節 時代劇變與學術教育的發達
江苏衡鼎律师事务所苏州分所 苏州广正知识产权代理有限公司
上海教育出版社 《历史与社会》九年级(全一册) 教师教材培训 深圳市南山区北师大南山附中 熊菊珍 年 8 月 13 日.
解放軍論壇 中共信息戰發展 對我國軍事戰略之影響.
多媒体通信技术 主讲教师:黄玉兰                学时:16.
桃園縣龜山鄉文欣國小 校園植物簡介 內庭區.
耶利米书.
河北民族师范学院图书馆志愿服务个案 张田吉
列王紀概覽.
专题五 高瞻远瞩 把握未来 ——信息化战争 主讲教师:.
第十章 现代秘书协调工作.
南亚、中亚 要点·疑点·考点 位置:位于喜马拉雅山以南,印度洋以北,大部分在10°N~30 °N之间 内陆国——尼泊尔、锡金、不丹
張騫、班超通西域.
第二篇 压缩与编码 数字信号的压缩与编码是多媒体的核心技术和重要内容 音频信号的差分/自适应/LPC编码就是典型的压缩编码 本篇内容:
传道书 12种虚空 9处不可知 23样价值观 7个小结论 人生是虚空的虚空! (没有神的人生)
朝代接龙(排一排,把下列朝代按建立的先后顺序排列)(10分)
会计电算化 录入期初余额 北京科技宏远有限公司总账系统启用日期有二种方案,一是2006年1月,二是2006年2月,其他初始设置完全一样,假定你是该公司会计主管,你选哪种方案?为什么?? ?
台湾是我国领土不可分割的一部分,台海局势总是引起各方关注,特别是美国。为什么美国对台湾虎视眈眈?
第一單元 儒家思想與中國社會 專題一 孔孟思想與儒家的發展.
我国处理民族关系的基本原则.
斗兽场 万神殿 圣彼得大教堂 君士坦丁凯旋门.
回忆与思考: 中国早期政治制度有哪些重要特点? ◇神权与王权结合; ◇以血缘关系为纽带形成国家政治结构;
第二课 走向“大一统”的秦汉政治.
11 室外装饰设计 本章提要 本章主要讲述了室外装饰设计的含义及其基本特征,室外装饰设计的基本原则,中外室外装饰设计的基本概况,室外装饰设计与室外环境的关系、建筑装饰的细部设计以及店面装饰设计等内容。
让“反思”成为一种习惯 北京一师附小 韩玉娟.
第六节 春秋战国时期的社会经济和社会变革.
異端與異教 基督信仰.
漢魏間的國際局勢與女性外交 -〈昭君怨〉與悲憤〈胡笳十八拍〉
Time Frequency Analysis and Wavelet Transforms Oral Presentation
彌迦書 緒論.
第九章 影像壓縮.
第5章、視訊媒體.
Principle and Application of Digital Television
視訊串流\Streaming Video Part-2-3 Compression Digital image/video
數位典藏之數位影像處理技術探討 雲端上的寶藏~ 國立新港藝術高中 蘇淵源.
淺談視訊壓縮技術 陳宏昇 楊凱超.
數位影像壓縮 技術簡介 第四組 陳孝賢.
第十章 轉換編碼 視轉換為座標軸之旋轉 視轉換為基底函數之分解 影像轉換 轉換編碼之方法 JPEG DCT 演算法 JPEG DCT 之結果
向量資料結構 (vector data structure)
VIDEO COMPRESSION & MPEG
图像压缩标准JPEG.
北國 亞述 巴比倫 南國 那鴻 以利亞 西番雅 以利沙 哈巴谷 約珥 約拿 俄巴底亞 阿摩司 北 何西阿 耶利米 以賽亞 以西結 南 彌迦
北国 亚述 巴比伦 南国 那鸿 以利亚 西番雅 以利沙 哈巴谷 约珥 约拿 俄巴底亚 阿摩司 北 何西阿 耶利米 以赛亚 以西结 南 弥迦
数字水印技术算法研究 曹锋 付晨 陈阳 cs.nju.
信号与图像处理基础 Image Compression 中国科技大学 自动化系 曹 洋.
2015 我爱永志我的家 摄影作品征集活动 2015年08月.
何西阿書.
第一章 JPEG介紹.
Presentation transcript:

第十一章 影像與視訊壓縮

內容 11.1 前言 11.2 消息理論 11.3 不失真壓縮 11.4 向量量化法 11.5 靜態影像壓縮 11.6 動態影像壓縮 11.3.1 霍夫曼編碼 11.3.2 算術碼

11.2 消息理論 定理11.2.1 給任意 n 個事件,其熵    。 證明: n 個事件且機率分別為 、 、…和 。 

圖11.2.1 的示意圖

Kraft不等式 。 長度為  ,      假設完成了 後,為避免發生 為 的前置碼(Prefix Code),則必須滿足條件 ,這裡 為不合法的碼數。 同理,考慮時   ,則需滿足 。不等式兩邊同除以 ,可得 。依此類推,可得下列Kraft不等式 Kraft不等式將幫助證明熵可視為平均碼長的下限。 編碼 :  

定理11.2.2 令 且 已被編成長度為 的碼, 則熵 ,這裡L代表平均碼長。 已知 證明:  又

巨集符號(Macro Symbol)集的平均碼長 n個符號形成一個巨集符號(Macro Symbol)。 字母集  假設兩兩符號為彼此獨立   表一個巨集符號所需的位元長度。 推得 若n趨近於無窮大,則 。

11.3 不失真壓縮 11.3.1 霍夫曼編碼 霍夫曼樹 符號集 對應頻率 符號集       對應頻率 Key: 將頻率最小的二個符號編碼,可建構出圖11.3.1.1的霍夫曼樹。 碼可編成 = 碼長度為 圖11.3.1.1 霍夫曼樹

範例1:給一4×4灰階影像,請建出霍夫曼樹並寫出灰階值50的霍夫曼碼長。 60 102 80 95 40 155 50

解答:S=<40,50,60,80,95,102,155>,而W=<1,1,2,2,3,3,4>,霍夫曼樹如下: 灰階值50的霍夫曼碼長為4 解答完畢

單邊成長(Single-side Growing)霍夫曼樹 首先令    且   。           。單邊成長霍夫曼樹往左成長,所以         。可建出圖11.3.1.2的單邊成長霍夫曼樹且                     令 代表第i層的葉子樹。 令 代表第i層的內部節點數。 給     ,  , 需跳過    中的兩個樹葉  ,  解碼只需 的時間,d指的是單邊成長霍夫曼樹的深度。 圖11.3.1.2 單邊成長霍夫曼樹

速度最快的霍夫曼解碼器 圖11.3.1.3 霍夫曼樹 在霍夫曼樹上進行廣先搜尋,在內部節點旁存上    的值,r代表位於同一層但在該內部節點左邊的內部節點數;l 代表在同一層上,內部節點右邊的節點數。第0層到第2層形成了一個完全子樹,可利用     變數記錄這特性。儲存 令輸入          ,          , ,  霍夫曼解碼可在 的時間內完成。

11.3.2 算術碼 字母集 且字母的機率為 、 、 和 。我們要編碼的訊息為 我們可用標簽的中間值0.2844表示原始之訊息。 字母集      且字母的機率為 、 、 和 。我們要編碼的訊息為 我們可用標簽的中間值0.2844表示原始之訊息。 收方收到的值是0.2844該如何解碼呢?因為0.2      ,可知第一個字母為 ;從0.28     可知第二個字母亦為 。最終可推得原訊息為    。

11.4 向量量化法 令碼表中的碼為 而待搜尋的區塊向量為 X,找到 使得 這裏 , 。

再令 , , 金字塔式向量搜尋法 給二非負整數x和y  對任意向量       ,令

回到VQ的方法上,令  若每四個元素縮成一個平均值 其中q表示金字塔的高度。 不等式中, 為 X 縮小 1/4 後的上一層之向量,而  為 的上一層之向量,這裡 X 和 Ci 皆為最底層的向量。 每一個 Ci 皆事先建好自己的金字塔。X也建出屬於自己的金字塔。計算兩金字塔的頂端的相關值,即 。若計算得到的值比目前暫時的最小值都來的大時,則 就不必再往金字塔的下層考慮了。

11.5 靜態影像壓縮 JPEG一直是彩色影像和高灰階影像的壓縮標準。JPEG首先將輸入的影像切割成 8  8 的子影像集。將輸入全彩影像中每一像素的R、G和B值轉換為Y、Cb和Cr值。 (1) 將DCT作用在 8  8 的子影像上:每一像素皆先減去128,以下列的計算完成DCT 圖11.5.1 經DCT 作用後的結果 (a) 8  8子影像 (b) 8  8係數矩陣

(2)將第(1)步驟所得的頻率域值除以8  8量化表(Quantization Table) 圖11.5.2 量化表與量化後的結果 (a) 8  8量化表 (b) 8  8量化後DCT係數矩陣 (3)將第(2)步驟所得的結果四捨五入以取整數 圖11.5.2(b)的DCT係數矩陣經IDCT(Inverse DCT) 作用後,可得解壓後的影像,如圖11.5.3所示。 圖11.5.3 8  8解壓後影像

(5)針對AC進行Run-Length編碼 (4)依據Zig-Zag的掃描次序,將第(3)步驟所得的結果依低頻為先的原則,圖11.5.2(b)的向量型式為(39,-3,2,1,-1,1,0,0,0,0,0,-1,0,0,0, … ,0,0,0)。 圖11.5.4 Zig-Zag掃描次序 (5)針對AC進行Run-Length編碼 (6)進行DPCM(Differential Pulse Code Modulation)和霍夫曼編碼(Huffman Encoding) 可編碼為(0,-3)(0,2)(0,1) (0,-1)(0,1)(5,-1)EOB 在Run-Length編碼的格式(x,y)中,x通常採用固定長度編碼,而y則依照事先建好的圖11.5.5表進行變動長度編碼。上述的向量型式進一步編成(0,2)(00)(0,2)(10)(0,1)(1)(0,1)(0)(0,1)(1)(5,1)(0) 1 -1,1 2 -3,-2,2,3 3 -7,…,-4,4,…,7 4 -15,…,-8,8,…,15 : 位元數 y 的範圍 圖11.5.5 y 的編碼對照表

11.6 動態影像壓縮 視訊壓縮 (Video Compression) 中,例如MPEG或H.264/AVC,我們先將視訊影像分成三類,分別為 I 、 P 和 B 影像。 I 影像用Intra Mode壓縮即可。 P 影像可利用前面的 I 影像,透過區塊匹配   (Block Matching) 和補償 (Compensation) 來壓縮。 夾在 I 和 P 之間的 B 影像之區塊就由 I 和 P 所匹配到   的區塊內插而成。 I P B

區塊匹配 在MPEG或H.264/AVC中,區塊匹配是核心的工作。 區塊匹配是在前一張參考影像中找到某一區塊,使得找到的區塊和目前區塊最匹配。通常是採用在前張影像中先訂出一個搜尋視窗,在這搜尋視窗內包含許多與目前區塊相同大小的正方形區塊。因此進行區塊匹配前得先決定搜尋的範圍和區域。

Feng等人[22]。 假設目前區塊為 Bc,西邊鄰近區塊、西北邊鄰近區塊和北邊鄰近區塊會用來產生 Bc 的初始移動向量。接著,利用初始移動向量所得的區塊 B’r,計算兩者的絕對差平均值(Mean Absolute Difference, MAD): 若得到的值很大,則 Bc 屬於高移動區塊,搜尋視窗為原始搜尋範圍。若是中等的值,則屬於中移動區塊,搜尋範圍為原始搜尋範圍的一半。否則屬於低移動區塊,搜尋範圍則為1/4的原始搜尋範圍。 應用到全搜尋(Full Search)演算法後,有60%以上的時間改良率。估計精確度和全搜尋演算法則是差不多。

[24]實際分析圖11.6.1所示的五種視訊檔中的機率,給出類型配對和搜尋範圍間更合理的建議。而為了節省乘法和除法的計算,以累計絕對差 (Accumulated Absolute Difference, AAD) 當作區塊間的相似量度。定義如下: 由式子可知,對每個目前區塊算出參考影像中最匹配的區塊,然後紀錄 。

根據實驗,發現D=4時,幾乎涵蓋大多數的最大絕對值位移。圖11.6.2為五種視訊檔的不同絕對位移分佈圖。 銷售員 花園 月曆車 蘇西 足球 圖11.6.2 五種視訊檔的不同D分佈圖 百分比

令 代表在視訊檔l中的第i張影像中隨機變數D的機率值。D的平均機率可表示為 令 ,這個值在決定最低搜尋範圍時會用到。

(0,0) D=0 (1,1) D=1 (1,0) (3,2) D=3 (2,0) D=2 (3,1) (5,3) D=5 (6,2) D=6 (2,1) (2,2) 圖11.6.4 一個例子 (3,2) (5,3) (4,1) (4,2) (a)參考影像 (b)目前影像 假設在視訊檔 l 中的第i張影像已被分割成5×5個區塊,見圖11.6.4(a) ,圖中的(x,y)代表該區域的移動向量(Motion Vector)值。圖11.6.4(b) 這四個鄰近區塊的移動向量之平均值可用來預測Bc 的初始移動後的Bc 。 由圖11.6.4(a)可算得 , , , , , , 。利用式子 可得到 。

完全搜尋(Full Search) 我們假定在搜尋範圍中的某一搜尋正方形,如圖11.6.5所示的中間較小框框 。若Bc在 內找到最匹配的區塊,則完成匹配。否則在 的邊緣上找一暫時最匹配的區塊所在處定一3×3的視窗如圖11.6.5中以A點為中心的視窗。接著在這小視窗中找Bc的最佳匹配區塊。直到找到最佳的匹配區塊為止。 圖11.6.5 區塊匹配

贏家修正策略(Winner-update Starategy) 沿用11.4節中的符號 X 和 , ,但 X 為目前影像中的待匹配區塊,而 為前一張參考影像中在搜尋範圍內的所有區塊,這裡假設十六維的向量 。為方便說明,假設 ,且各個向量只有三維。 首先,我們檢查 、 、 和 的第一個元素,假如四個元素如下所示

因為 為最小者,就繼續看 並且計算出 ,假定目前的前置和如下所示 這時因為 為前置和中最小值,所以計算 =3+6+9。目前的前置和如下所示

重複同樣的方式,假設最終的前置和如下所示 則由 可知 和 最匹配。