第十章 轉換編碼 視轉換為座標軸之旋轉 視轉換為基底函數之分解 影像轉換 轉換編碼之方法 JPEG DCT 演算法 JPEG DCT 之結果

Slides:



Advertisements
Similar presentations
完美殺人筆記簿 【爸!我受夠了!】 第七組組員: 林正敏 陳筱涵 李蓓宇 許純宜 羅玉芬 謝文軒.
Advertisements

对本书、视频等任何 MATLAB 问题,作者做到有问必答! 你买的不仅仅是书,更是一种 “ 有问必答 ” 的服务!
XX啤酒营销及广告策略.
說 劍 《莊子‧雜篇》─ 第 一 組 賴泊錞 謝孟儒 張維真 羅苡芸
大學入學考試中心 九十六學度學科能力測驗試題 國文科 -哈利波特番外篇-
第六节 美国 ■移民国家与多元化 ■现代化的农业 ■引领美国制造业的高新技术产业.
MPEG Family.
簡報大綱 壹、現況說明 貳、改革方案 參、改革效益 肆、信賴保護的問題 伍、公保再修正情形 陸、外界關心的問題 1 1.
第二章 多媒体数据压缩编码技术.
老子的素朴 厦门大学计算机科学系 庄朝晖.
6.1 概述 6.2 信源编码与压缩技术 6.3 信道编码与调制技术
第十章 图像的频域变换.
Outline Image Compression Image Understanding
補救教學實施策略 國立新竹教育大學 高淑芳.
102年10月17日 臺北市公共運輸處 報告人:陳榮明處長
交通事故處置 當事人責任與損害賠償 屏東縣政府警察局交通隊.
初中语文总复习 说明文 阅读专题 西安市第六十七中学 潘敏.
多媒体通信技术 主讲教师:黄玉兰                学时:16.
国家和我省禽业发展政策 和扶持项目解读 安徽省畜牧兽医局
电话联系.
迎宾员礼仪 包头机电工业职业学校管理系 白琳 1.
院長:鄭錦聰 教授 各系負責老師 光電系:姬梁文老師 電機系:張凱雄老師 資工系:謝仕杰老師 電子系:陳柏宏 老師
面向海洋的开放地区——珠江三角洲 山东省高青县实验中学:郑宝田.
1.5 地球运动的地理意义(一) 自 转意义 一、昼夜交替 昼夜现象 1、昼夜更替 周期是24小时(1太阳日) 地球是一个不发光
第1节 光的干涉 (第2课时).
财 务 会 计 第四篇:供应链会计实务 制作人:谌君、熊瑜.
第4章 种群和群落 第3节 群落的结构 自主学习案   合作探究案 课后练习案. 第4章 种群和群落 第3节 群落的结构 自主学习案   合作探究案 课后练习案.
北师大版七年级数学 5.5 应用一元一次方程 ——“希望工程”义演 枣庄市第三十四中学 曹馨.
苏教版小学数学六年级(下册) 认识正比例的量 执教者:朱勤.
水晶城项目2011年操盘思路 深蓝地产机构 2010年12月编制.
海洋存亡 匹夫有责 ——让我们都来做环保小卫士 XX小学三(3)班.
Audio.
Time Frequency Analysis and Wavelet Transforms Oral Presentation
XV. Applications of Wavelet Transforms
XVI. Applications of Wavelet Transforms
狂賀!妝品系同學美容乙級通過 妝品系三甲 學號 姓名 AB 陳柔諺 AB 陳思妤 AB 張蔡婷安
第十一章 影像與視訊壓縮.
第九章 影像壓縮.
視訊串流\Streaming Video Part-2-3 Compression Digital image/video
數位典藏之數位影像處理技術探討 雲端上的寶藏~ 國立新港藝術高中 蘇淵源.
電腦數位音樂介紹 11組 電機三 陳俊傑 吳岳庭.
淺談視訊壓縮技術 陳宏昇 楊凱超.
數位影像壓縮 技術簡介 第四組 陳孝賢.
第三章:Huffman编码 信源概率模型已知的Huffman编码 信源概率模型未知的Huffman编码 Huffman编码中的码字设计
混合式浮水印技術應用於H.264/AVC 錯誤偵測及隱匿
数字图像处理 第十二章 离散图像变换.
Source: IEEE Transactions on Image Processing, Vol. 25, pp ,
第3章 图像变换.
第8章 DCT与JPEG编码 JPEG(Joint Photographic Experts Group联合图象专家组)是(ITU的前身)国际电话与电报咨询委员会CCITT与ISO于1986年联合成立的一个小组,负责制定静态图像的编码标准 1992年9月JPEG推出了ISO/IEC 10918标准(CCITT.
检验 Chi-Squared Test Goodness-of-fit Test 拟合优度检验 & Test of Row and Column Independenc 独立性检验 欧阳顺湘 北京师范大学珠海分校.
第十章 模糊图像变换编码 指导教师:高新波 学 生: 王来雄 年 1 2 月.
A high payload data hiding scheme based on modified AMBTC technique
第三章 付里叶分析 离散付氏级数的数学解释(The Mathematical Explanation of DFS)
VIDEO COMPRESSION & MPEG
第十章 模糊图像变换编码 任课教师: 高新波 报告人: 包志强 年 1 2 月.
健康體育網路護照操作 STEP1 於教育部體適能網站進入「健康體育網路護照」.
VII. Data Compression (A)
图像DCT变换 《信息隐藏实验教程》教学幻灯片 五.
图像压缩标准JPEG.
Predictive Coding Chapter /4/28 資料壓縮 ※ 第七章 預測編碼 ※
平面与平面平行的性质 主讲 陈芝飞.
信号与图像处理基础 Image Compression 中国科技大学 自动化系 曹 洋.
线段 射线 直线.
第3章 数字编码 3.1 信源编码 3.2 信道容量 3.3 差错控制编码 3.4 几种差错控制编码简介 3.5 数字压缩编码
1.理解力和运动的关系,知道物体的运动不需要力来维持。
2015 我爱永志我的家 摄影作品征集活动 2015年08月.
醫工所碩士二年級 R 葉昱甫 電子所碩士一年級 R 謝博鈞 電信所碩士一年級 R 王欣平
美丽的旋转.
第一章 JPEG介紹.
Hybrid fractal zerotree wavelet image coding
Presentation transcript:

第十章 轉換編碼 視轉換為座標軸之旋轉 視轉換為基底函數之分解 影像轉換 轉換編碼之方法 JPEG DCT 演算法 JPEG DCT 之結果 總結 靜宜大學資訊工程系

轉換編碼(transform coding) 轉換編碼的做法 將原訊號經過一個轉換變成另一種表示法。轉換後的表示法之能量較原始訊號來得集中,而且可以經由逆轉換(reverse transformation)回復成原始訊號。 轉換編碼包含兩個部分 正向轉換處理(forward transformation) 逆向轉換(reverse transformation) 轉換編碼的特性 理論上,轉換編碼必須是可逆的 實際的運作會受限於資料型態與電腦的溢位(overflow or underflow)而造成失真

轉換編碼(transform coding) 影像轉換的做法 將原來N×N的影像先分割成不重疊的n×n影像區塊,然後對每一個區塊進行單位轉換(unitary transform) ,將原本影像區塊中的像素相關性打散,使得訊號的能量集中於很少數的幾個轉換係數中,如此一來,許多不重要的轉換係數再經過量化後就可忽略,可提升整體的編碼效率。 可配合HVS(Human visual system)之對比敏感函數於轉換係數的量化工作上,而達到視覺的無失真壓縮。

absolute dct values of lenna row 256 Row 256 of lenna absolute dct values of lenna row 256 2500.00 200.00 2000.00 160.00 1500.00 120.00 1000.00 80.00 40.00 500.00 0.00 0.00 0.00 200.00 400.00 600.00 0.00 200.00 400.00 600.00

利用DFT轉換前後的範例

10.1 視轉換為座標軸之旋轉 二維向量的座標軸轉換 假設x1x2座標系統上的每一個二維向量x代表一對相鄰的像素值 定義xj軸的變異數(variance)為: 其中,M代表影像中的向量總數, xji是第i個向量的xj值,xj是所有的向量的xj之平均值。

10.1 座標軸旋轉的例子

10.1 視轉換為座標軸之旋轉 單位轉換(unitary transform) 轉換的特性 為一可逆之線性轉換,其核心為一組完整、相互正交之單位基底函數。 單位轉換不會改變向量間的歐基里得距離(Euclidean distance) ,也就是它具有距離保持性。 所以經過單位轉換前後的總變異數大小不變 轉換的特性 將原本資料的相關性(取樣間累贅)打散,並將訊號的大部分能量集中到相當少的轉換係數上 轉換本身並不能達到資料壓縮的效果

10.1 視轉換為座標軸之旋轉 二維座標轉換:旋轉45度 正轉換 Y=AX,其中A為轉換矩陣 逆轉換 X=BY,其中B=A-1。

10.2 視轉換為基底函數之分解 轉換的動作可視為座標軸的旋轉 把在X與Y中的每一列視為基底函數 Y=AX ,其中A為轉換矩陣 X=BY ,其中B=A-1。 不同的轉換只是旋轉的方式不同而已。 把在X與Y中的每一列視為基底函數 正轉換可看成將原本的影像分解成一組給定之基底函數的線性和(linear sum) ,所得到之係數即各基底函數作線性和時所該乘上的加權比重。 逆轉換可看成將給定的基底函數乘上轉換係數Y作為各基底函數之加權比重。

10.3 影像轉換 影像轉換的基本特性 將影像內像素間的相關性打散 利用獨立於影像的基底函數 轉換需能快速完成 希望能將大部分的能量集中於少數的轉換係數上 利用獨立於影像的基底函數 最佳的轉換函數會隨著影像區塊的統計特性而不同,也就是必須針對不同的影像區塊使用不同的基底函數 通常會捨棄最佳的轉換而採用獨立於影像的基底函數,也就是針對任意的影像區塊都使用相同的基底函數 轉換需能快速完成 N個點轉換所需的計算一般為O(n2) 的等級。有一些轉換具有快速演算法能將其所需的計算量由O(n2) 的等級,降低至O(nlogn) 的等級。因此對於一個可分開的n×n的二維轉換,藉由依序作橫列及縱列的一維轉換,其所需的計算量為O(n2logn) 而非O(n4) 。

10.3.2 數位傅利葉轉換(DFT) 數位傅利葉轉換(DFT) DFT通常被用在做頻譜分析與濾波器之設計上,對於一個n×n的方塊,二維正DFT之定義為 二維逆DFT定義為 其中 ,f 為原始影像訊號,F 為轉換後之結果。

10.3.2.數位傅利葉轉換(DFT) DFT轉換的二維核心(kernel)是可分開的 因此二維的DFT可以用一維的DFT來完成 DFT產生的係數為複數(包括實部與虛部) ,而儲存與處理這些2n2個轉換項的複數是DFT的缺點。但是因為這些轉換項具有共軶對稱性,因此有將近一半的轉換項實際上可由其他轉換項所算得。

10.3.3. 數位餘絃轉換(DCT) 一個n×n的影像區塊其二維DCT正轉換為 一個n×n的影像區塊其二維DCT逆轉換為 其中f 為原始影像訊號,F 為轉換後之結果。

10.3.3 數位餘絃轉換(DCT)

10.3.3 數位餘絃轉換(DCT)

10.3.5 Walsh-Hadamard 轉換(WHT) 基底函數為不同頻率的方波 基底函數非常簡單,只含+1與-1 適合硬體實作 將原始資料相關性打散的能力略差

10.3.5 Walsh-Hadamard 轉換(WHT) ,其中H2n為2×2的Hadamard矩陣

10.3.5 Walsh-Hadamard 轉換(WHT)

10.4 轉換編碼之方法 一般轉換編碼都使用DCT或WHT 這種獨立於影像的二維轉換,而在轉換後得到轉換係數後(coefficients) ,採用特定的方法來作選擇,量化以及編碼這些係數。 轉換函數 影像區塊 轉換係數 區域取樣之選擇法 編碼 量化

10.4.1 區域取樣之選擇法 區域取樣之選擇法 區域區樣法(zonal sampling) 如果轉換係數視坐落在某個特定區域內,則予以保留;否則將其值設為0。 保留的係數隨後進行量化與編碼的動作 可利用固定位元數編碼或依照頻率給定不同的位元數 位元配置法(bit allocation) 在每一個區域內的係數可以使用不同的位元數(但總位元數相同) ,使得整個量化誤差最小 第一回合需計算係數方差值(variance)並決定量化器的位元分配 第二回合真正為每一個方塊作編碼的動作

10.5 JPEG 演算法 JPEG包含三個主要元件 基本系統(base system) 系統擴充程式 獨立的無失真壓縮法 滿足大部分的影像編碼使用之演算法 系統擴充程式 包含12bit/pixel的輸入,漸進式(progressive)以及階層式重建(hierarchical build-up) 獨立的無失真壓縮法 DPCM/Huffman Coding DPCM/Arithmetic Coding

10.5.1 JPEG 基本系統 Input image Blocking DCT Thresholder Binary bit stream Entropy coder Zigzag Scan 1-D sequencing Quantizer Entropy decoder Inverse Zigzag Scan Dequantizer output image Blocking Integration Thresholder compensator IDCT

10.5.1 JPEG 基本系統 DCT/IDCT formula Separable BASIS2D(i,j;u,v) = BASIS1D(i;U)BASSIS1D(j ; v) process row, then column.

10.5.1 JPEG 基本系統 Quantization T=deadzone threshold T+3Q/2 T+Q/2 -T-2Q -T-Q -T T T+Q T+2Q -T-Q/2 -T-3Q/2 T=deadzone threshold Q=quantizer step size

JPEG 基本系統 二維DCT之結果的係數矩陣中,左上角那個係數稱為直流係數(DC) ,它與原方塊之平均明亮度成正比;其他的63個轉換係數成為交流係數(AC) 。 直流係數會以無失真的DPCM作編碼,DPCM是利用前一個方塊的直流係數來作預測 交流係數量化後會產生許多0,尤其是高頻的部分,為了能夠從這些0取得好處,原來的二維DCT係數會以鋸齒狀掃描(zigzag scan)成一維向量。

JPEG 基本系統

JPEG 基本系統 編碼交流係數(AC) 每一個非零的係數首先會以8位元(0-255)(以I來描述) ,其二進位形式為 I=‘NNNNSSSS’ 四個最低位元SSSS用來定義係數的大小類別 前四個位元NNNN用來記錄相對於前一個非0系數的位置 I=0 表示方塊結束(end of block) I=‘11110000’表示一個長度為16的連續0 總共有10*16+2=162個符號 每個符號送出前均經過 Huffman 編碼 接著傳送對應類別所需的k個位元 第k類別的範圍為(2k-1, 2k-1)與(-2k+1, -2k-1)

JPEG 基本系統

JPEG 基本系統

10.5.2 JPEG DCT之一例

10.5.2 JPEG DCT之一例 所有的轉換係數藉由使用一個使用者自訂的正常化矩陣(normalization matrix)達到正常化的目的。

10.5.2 JPEG DCT之一例 79 0 -2 -1 -1 -1 0 0 -1 EOB

10.5.2 JPEG 基本系統—解壓縮 量化後的係數先藉由Huffman解碼法重建,然後依下面的式子與以逆正常化 接著利用整數DCT做逆轉換,得到重建的方塊。

10.5.2 JPEG 基本系統—解壓縮 由編碼所產生的誤差為

10.5.2 JPEG 基本系統—解壓縮

Results 786488 bytes 23116 bytes, Cr=34.0

Results 786488 bytes 33079 bytes, Cr=23.78

Results 786488 bytes 49746 bytes, Cr=15.80

Results 786488 bytes 26614 bytes, Cr=29.55

Results 786488 bytes 25485 bytes, Cr=30.86

JPEG Lossless Coding DPCM Prediction No 1 A 2 B 3 C 4 A+B-C 5 No 1 A 2 B 3 C 4 A+B-C 5 A-(B-C)/2 6 B-(A-C)/2 7 (A+B)/2