电子科技大学光电信息学院，二教106，沙河校区

Slides:

Advertisements

Similar presentations

因数与倍数 2 、 5 的倍数的特征

Advertisements

3 的倍数的特征的倍数有 : 。 5 的倍数有 : 。既是 2 的倍数又是 5 的倍数有 : 。 12 ， 18 ， 20 ， 48 ， 60 ， 72 ，， 25 ， 60 ，

第四章多媒体数据压缩编码技术多媒体数据压缩编码技术的重要性和分类多媒体数据压缩编码技术的重要性和分类量化统计编码预测编码变换编码多媒体数据压缩编码的国际标准.

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

全微分教学目的：全微分的有关概念和意义教学重点：全微分的计算和应用教学难点：全微分应用于近似计算.

练一练：在数轴上画出表示下列各数的点，并指出这些点相互间的关系： -6 ， 6 ， -3 ， 3 ， -1.5, 1.5.

信号与系统第三章傅里叶变换东北大学 2017/2/27.

第六章图象数据压缩编码基本内容图像压缩基础无损压缩有损压缩静止图像压缩编码的技术标准JPEG.

第二章多媒体数据压缩编码技术.

第5章图像编码与压缩.

第三章函数逼近 — 最佳平方逼近.

多媒体通信技术主讲教师：黄玉兰　　　　　　　　　　　　　　　　学时：16.

第三章数据类型和数据操作对海量数据进行有效的处理、存储和管理 3.1 数据类型数据源数据量数据结构

第6章图像压缩.

§5.3 定积分的换元法和分部积分法一、定积分的换元法二、定积分的分部积分法三、小结、作业.

第5章定积分及其应用基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法

不确定度的传递与合成间接测量结果不确定度的评估

2-7、函数的微分教学要求教学要点.

C++中的声音处理在传统Turbo C环境中，如果想用C语言控制电脑发声，可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为： Beep(频率,持续时间) , 单位毫秒暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒引用这两个函数时，必须包含头文件

多媒体技术基础(第3版) 第2章数据无损压缩张奇复旦大学计算机科学技术学院 2015年4月.

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

第九章影像壓縮.

數位典藏之數位影像處理技術探討雲端上的寶藏~ 國立新港藝術高中蘇淵源.

第六章图像编码 CHAPTER 6 IMAGE ENCODING §1 基本概念 §2 简单编码方法 §3 预测编码方法

四川大学计算机学院陈虎多媒体技术基础四川大学计算机学院陈虎

走进编程程序的顺序结构（二）.

數位影像壓縮技術簡介第四組陳孝賢.

基于全方位视觉的多人体运动检测跟踪利用全方位摄像机获取360˚ 的环境信息，在室内对多个人体目标进行实时运动检测。

计算机数学基础主讲老师: 邓辉文.

第十章方差分析.

多媒体技术中南大学信息科学与工程学院黄东军.

第八章图像编码图像压缩与编码基本概念哈夫曼编码香农-范诺编码行程编码算术编码变换编码静止图像压缩编码标准-JPEG

第一章函数与极限.

图片与视频数字化. 图片与视频数字化图片分类根据图片的构成元素来分位图：由像素组成，计算机按顺序存储每个像素点的颜色信息的保存方式获得的图片。位图放大后会模糊失真，存储空间相对较大。矢量图：由图元组成，通过数学公式计算获得的图片。放大后不会失真，占用空间小。

学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.

VII. Data Compression (A)

图像压缩标准JPEG.

顺序表的删除.

概率统计主讲教师叶宏山东大学数学院.

线性代数厦门大学线性代数教学组 2019年4月24日6时8分 / 45.

第十章双线性型 Bilinear Form 厦门大学数学科学学院网址: gdjpkc.xmu.edu.cn

用计算器开方.

多媒体通信原理第2章数据压缩编码基本理论.

第4章 Excel电子表格制作软件 4.4 函数（一）.

多媒体技术中南大学信息科学与工程学院黄东军.

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

3.16 枚举算法及其程序实现 ——数组的作用.

信号与图像处理基础 Image Compression 中国科技大学自动化系曹洋.

第4课时绝对值.

多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

2019/5/21 实验一离散傅立叶变换的性质及应用实验报告上传到“作业提交”。 11:21:44.

§2 方阵的特征值与特征向量.

生物信息学 Bioinformatics 巩晶癌症研究中心山东大学医学院

图片与视频数字化. 图片与视频数字化图片分类根据图片的构成元素来分位图：由像素组成，计算机按顺序存储每个像素点的颜色信息的保存方式获得的图片。位图放大后会模糊失真，存储空间相对较大。矢量图：由图元组成，通过数学公式计算获得的图片。放大后不会失真，占用空间小。

基于列存储的RDF数据管理朱敏

C++语言程序设计 C++语言程序设计第一章 C++语言概述第十一组 C++语言程序设计.

第四节向量的乘积一、两向量的数量积二、两向量的向量积.

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

数据表示第 2 讲.

第三节数量积向量积混合积一、向量的数量积二、向量的向量积三、向量的混合积四、小结思考题.

数字图像处理北京大学计算机研究所陈晓鸥.

第十七讲密码执行(1).

第十章模糊图像变换编码学生：罗龙二零零六年十二月.

§4.5 最大公因式的矩阵求法（ Ⅱ ）.

最小生成树最优二叉树.

§2 自由代数定义19.7:设X是集合，G是一个T-代数，为X到G的函数,若对每个T-代数A和X到A的函数，都存在唯一的G到A的同态映射,使得=，则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变， 变 变， 也变对给定的 和A，是唯一的.

Presentation transcript:

电子科技大学光电信息学院 2017.05.09，二教106，沙河校区第六章图像编码与压缩 Chapter06 Image coding and compression 彭真明 E-mail:zmpeng@uestc.edu.cn pengzm_ioe@163.com 电子科技大学光电信息学院 2017.05.09，二教106，沙河校区

主要内容编码及信息论概述行程编码 LZW编码霍夫曼编码预测编码变换编码压缩标准简介*

一、编码及信息论概述 1.图像压缩的必要性一幅512×512的灰度图像的比特数为： 512×512×8 = 2,097,152 bit = 262,144 byte = 256 k。可见，数字图像通常要求很大的比特数，这给图像的传输和存储带来一定的困难。要占用很多的资源，花很高的费用。

一、编码及信息论概述 1.图像压缩的必要性一部90分钟的彩色电影，每秒放映24帧。把它数字化，每帧512x512象素，每象素的R、G、B三分量分别占8 bit，总比特数为： 90×60×24×3×512×512×8bit = 97,200 (M) 若一张CD光盘可存600兆字节数据，这部电影图像（不包括声音）就需要160张CD光盘用来存储。

一、编码及信息论概述编码用符号数码元素表示信号、消息或事件的过程。图像编码研究图像数据的编码方法。期望用最少的码字表示信源发出的图像信号，使数据得到压缩，减少图像数据占用的信号空间和能量，降低信号处理的复杂程度。信号空间物理空间—存储器、磁盘等数据存储介质；时间空间—传输给定消息集合所需要的时间；频谱空间—传输给定消息集合所需要的带宽。

一、编码及信息论概述 2.图像压缩的可能性图像中像素灰度出现的不均匀性，造成图像信息冗余，即用同样长度比特表示每一个灰度，则必然存在冗余。图像能量在变换域内分布的不均匀性，比如大部分能量集中在低频部分，而小部分能量集中在高和较高的频率部分。图像像素灰度在时间和空间上的相关性造成信息冗余。

一、编码及信息论概述数据冗余空间冗余，邻近像素灰度分布的相关性很强；频间冗余，多谱段图像中各谱段图像对应像素之间灰度相关性很强；时间冗余，序列图像帧间画面对应像素灰度的相关性很强。

例析1：如果用8 bit表示下面图像的像素，可以说该图像存在着编码冗余。因为该图像的像素只有两个灰度，用1 bit即可表示。

例析2：对于一幅图像，很多单个像素对视觉的贡献是冗余的。这可以建立在对邻域值预测的基础上。例如：原图像数据： 250 253 251 252 250 压缩后数据： 250 3 1 2 0 40bit 14bit

一、编码及信息论概述应用环境允许图像有一定程度失真 (1) 接收端图像设备分辨率较低，则可降低图像分辨率； (2) 根据人的视觉特性，对不敏感区进行降分辨率编码（视觉冗余）； (3) 应用方关心图像区域有限，可对其余部分采用空间和灰级上的粗化； (4) 对于识别，图像特征抽取和描述也是数据压缩。

例析1：视觉心理冗余一些信息在一般视觉处理中比其它信息的相对重要程度要小，这种信息就被称为视觉心理冗余。 33K 15K

一、编码及信息论概述 3. 图像编码分类无失真编码（无损压缩、可逆压缩）是一种经编、解码后图像不会产生失真的编码方法。可重建图像，但压缩比不大；有失真编码（有损压缩、不可逆压缩）解码时无法完全恢复原始图像，压缩比大但有信息损失。失真：原图像与解码输出图像之间的随机误差；压缩比：原图像比特数与压缩后图像比特数之比。

一、编码及信息论概述图像压缩方法统计编码预测编码变换编码行程编码ＬＺＷ编码哈夫曼编码算术编码其他无损预测有损预测其他ＫＬＴ编码ＤＣＴ变换其他无损压缩有损压缩

一、编码及信息论概述信源的定义信源即能够产生信息的事物。数学上，信源是一概率场。若信源可能产生的信息是　　　，这些信息出现的概率分别是　　　　　。则该信源可表示为：

一、编码及信息论概述 4. 信息量和熵信息量：从N个相等可能发生的事件中，选出其中一个事件所需的信息度量，称为信息量。例如：要辨识1到32中选定的某一个数，可先提问：“是否大于16？”，得到回答就消去半数可能事件。每提问一次得到回答，可以得到1bit信息量(二进制位)。这里共需5次，因此所需的信息量为：

一、编码及信息论概述信息量的计算熵的计算从N个数选定一个数s的概率为p(s)，且等概率，p(s)=1/N。设信源符号表为s={s1, s2, … , sq}，其概率分布为P(s)={p(s1), p(s2), … , p(sq)}，则信源的熵为：

一、编码及信息论概述熵的作用例：信源熵表示信源中消息的平均信息量。在不考虑消息间的相关性时，是无失真编码平均长度比特数的下限。 H(s) = 说明：该信源编码平均码长最短情况下为7/4，不能再小，否则就会引起错误。而平均码长比此数大许多时，就表明压缩还有待改进。

一、编码及信息论概述熵的性质 (1) 熵是一个非负数，即总有H(s)≥0。 (2) 当其中一个符号sj的出现概率p(sj)=1时，其余符号si(i≠j)的出现概率p(si) =0，H(s)=0。 (3) 当各个si出现的概率相同时，则最大平均信息量为log2 q。 (4) 熵值总有，H(s) ≤ log2 q。

一、编码及信息论概述图像的熵 (1) s作为灰度，共q级，出现概率均等时，p(si)=1/q， (2)当灰度只有两级时，即si=0,1，且0出现概率为p1，1出现概率为p2=1-p1 ，其熵：

一、编码及信息论概述图像的熵 (3) 对８位图像，s作为灰度，共256级，其熵为： (4)当图像由单一灰度级组成时（即灰度均匀分布图像）, 其熵为：

一、编码及信息论概述 5.信息编码过程编码器是用符号集中的符号构成输出代码，并建立输入信号单元与输出代码的对应关系。编码器输出代码消息集合输出代码符号集符号(码元) 编码器

一、编码及信息论概述 6.无失真编码定理 L=H(s)+ε Claude Shannon (1916-2001) 6.无失真编码定理在无干扰条件下，存在一种无失真的编码方法，使编码的平均长度L与信源的熵H(s)任意地接近，即 L=H(s)+ε 其中， ε为任意小的正数。以H(s)为其下限，L≥ H(s)，即香农(Shannon)无干扰编码定理。

一、编码及信息论概述压缩率若原始图像的平均比特率为b，编码后的平均比特率为bd，则压缩率(比)C定义为：由Shannon定理，无失真编码最大数据压缩比为：

一、编码及信息论概述编码效率冗余度压缩率(比) or R接近于0，或编码效率接近于1的编码称为高效码。 Next Sect...

一、编码及信息论概述保真度(Fidelity) 主观客观总误差(Total error between the two images) 均方差(MSE) 客观信噪比(SNR) Signals Noises

主要内容编码及信息论概述行程编码 LZW编码霍夫曼编码预测编码变换编码压缩标准简介统计编码

二、行程编码 1. 概念：行程：沿行(或列)具有相同灰度值的像素序列。 2. 编码思想：行程编码(Run Length Encoding，RLE)是一种消除空间冗余的数据压缩方法。 1. 概念：行程：沿行(或列)具有相同灰度值的像素序列。 2. 编码思想：去除空间像素冗余。即用行程的灰度和行程的长度代替行程本身。

二、行程编码例：设重复次数为 iC, 重复像素值为 iP，则编码为：iCiP iCiP iCiP 编码前：aaaaaaabbbbbbcccccccc 编码后：7a6b8c 对于有大面积色块的图像，压缩效果很好。对于杂乱图像，压缩效果不好；最坏情况，会加倍数据。 Next Sect...

主要内容编码及信息论概述行程编码 LZW编码霍夫曼编码预测编码变换编码压缩标准简介*

三、LZW编码 1. 简介 1977年,以色列人Lempel和Ziv共同提出了查找冗余字符和用较短的符号标记替代冗余字符的概念，即LZ压缩技术。 1985年,美国人Welch将LZ压缩技术从概念发展到实用阶段,即LZW压缩技术。 LZW编码又称字串表编码，是一种无损编码。与行程编码类似，也是对字符串进行编码实现压缩，但它在编码的同时还生成了特定字符串及与之对应的索引字符串表。

三、LZW编码 2. 基本思想 —去除像素冗余。 (1) 在压缩过程中动态地形成一个字符序列表(字典)。 (2) 具体规则如下： (a) 每当压缩扫描图像发现一个字典中没有的字符序列，就把该字符序列存到字典中； (b) 用字典的地址（编码）作为这个字符序列的码字，替换原图像中的字符序列； (c)下次再碰到相同的字符序列，就用字典的地址代替字符序列。

三、LZW编码 3.基本步骤步骤1：将词典初始化为包含所有可能的单字字符，当前前缀P初始化为空(NULL)。步骤2：当前字符C:=字符流中的下一个字符。

三、LZW编码步骤3：判断P＋C是否在词典中? （1）如果“是”，则用C扩展P，即让P:=P＋C （2）如果“否”，则令P:=C，现在的P仅包含一个字符C

三、LZW编码步骤4：判断码字流中是否还有码字要译? （1）如果“是”，就返回到步骤2；（2）如果“否” 把代表当前前缀P的码字输出到码字流；结束。

LZW编码例析如：对字符串“aabcabbbbd” 进行编码初始化字符串表字符串索引(16进制) a 0 H b 1 H c 2 H LZW_CLEAR（初始化标记） 4 H LZW_EOI （结束标记） 5 H

LZW编码例析:“aabcabbbbd” 输入数据S2 S1+S2 输出结果 S1 生成的新字符串及索引 NULL NULL 4H NULL S1+S2在字符表中,S1=S1+S2 a a a S1为NULL,故输出结果为空 a aa 0H a aa <6H> S1+S2不在字符表中,S1=S2=“a” b ab 0H b ab <7H> aa不存在,故输出S1=“a”的索引0H c bc 1H c bc <8H> a ca 2H a S1+S2不在字符表中,S1=S2=“b” ca <9H> ab不存在,故输出S1=“a”的索引0H b ab ab b abb 7H b abb <AH> S1+S2在字符表中,S1=S1+S2 b bb 1H b bb <BH> S1+S2结果已存在,故输出结果为空 bb bb b d bbd BH d 输出S1的索引3H bbd <CH> 3H 输入结束 5H 输出LZW_EOI标志的索引 Next Sect...

主要内容编码及信息论概述行程编码 LZW编码霍夫曼编码预测编码变换编码压缩标准简介

四、霍夫曼(Huffman)编码 1. 简介霍夫曼(Huffman)编码是可变字长编码(Variable length coding，VLC)的一种。该方法由Huffman(1952)提出，它完全依据字符出现概率来构造异字头的平均长度最短的码字，常被称作Huffman编码，有时称之为最佳编码。

四、霍夫曼(Huffman)编码 2. 基本思想通过减少编码冗余来达到数据压缩的目的。规定： (b) 建立一个概率统计表。规定：将最常出现(概率大的)的符号用最短的编码；最少出现的符号用最长的编码。

例析1：Huffman编码例题：信号源 s={s1, s2, s3, s4, s5, s6}，其概率分布为p1=0.4, p2=0.3, p3=0.1, p4=0.1, p5=0.06, p6=0.04，求最佳Huffman码。计算步骤：将信源符号按出现概率从大到小排成一列，然后把最末尾的两个符号的概率相加，合成一个概率。

例析1：Huffman编码把这个符号的概率与其余符号的概率按从大到小排列，然后再把最末两个符号的概率加起来，合成一个概率。重复上述做法，直到最后剩下两个概率为止。从最后一步剩下的两个概率开始逐步向前编码，每步只需对两个分支各赋予一个二进制码。例如，对概率大的赋予码元0，对概率小的赋予码元1。

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 自然码 000 001 010 011 100 101

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3 第④步 0.6 0.4

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3 第④步 0.6 0.4 1 1 1 1 1

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3 第④步 0.6 0.4 1 1 1 1 1 S1 = 1

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3 第④步 0.6 0.4 1 1 1 1 1 S2 = 00

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3 第④步 0.6 0.4 1 1 1 1 1 S3 = 011

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3 第④步 0.6 0.4 1 1 1 1 1 S4 = 0100

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3 第④步 0.6 0.4 1 1 1 1 1 S5 = 01010

例析1：Huffman编码输入 S1 S2 S3 S4 S5 S6 概率 0.4 0.3 0.1 0.06 0.04 第①步 0.4 第②步 0.4 0.3 0.2 0.1 第③步 0.4 0.3 第④步 0.6 0.4 1 1 1 1 1 S6 = 01011

例析1：Huffman编码平均码长自然码长m = 3 信源的熵压缩结果 L = 0.4×1+0.3×2+0.1×3+0.1×4+0.06×5 +0.04×5 ≈ 2.2 (bit/像素) 信源的熵 H(s) = -(0.4×log2(0.4)+0.3×log2(0.3)+0.1×log2(0.1) +0.1×log2(0.1) +0.06×log2(0.06)+0.04×log2(0.04)) ≈ 2.14 (bit/像素) 压缩结果压缩比(C)： = m / L = 3 /2.2 ≈ 1.364 编码效率(η)： = H(s) / L = 2.14/2.2 ≈ 97.3% 冗余度(R)： = 1 - η ≈ 0.027 = 2.7 %

例析2：Huffman编码例如，对下面的一首英文歌词进行Huffman编码： Because I’m bad, I am bad — come on Bad, bad — really, really bad You know I’m bad, I'm bad — Bad, bad — really, really bad You know I’m bad, I'm bad — come on, you know Bad, bad — really, really bad

例析2：Huffman编码短语及其概率统计表短语符号频率概率 Because B 1 1/35 = 0.03 I’m I 6 1/35 = 0.03 I’m I 6 6/35 = 0.17 Bad 15 15/35= 0.43 Come on C 2 2/35 = 0.06 It Really R 6/35 = 0.17 You know Y 4 4/35 = 0.11

编码过程的树结构表示 (1.00) S6 (0.57) 1 S5 01 (0.23) B/0.43 (Bad) 00 S3 (0.34) (0.57) 1 S5 01 (0.23) B/0.43 (Bad) 00 S3 (0.34) 010 (0.12) S4 011 S2 0100 001 (0.06) 000 Y/0.11 (You know) 0101 S1 I/0.17 (I’m) R/0.17 (Really) 01000 C/0.06 (Come on) 01001 B/0.03 (Because) I/0.03 (It)

例析2：Huffman编码短语、码长及编码结果统计表短语符号频率概率代码长度编码 Because B 1 0.03 5 01001 I’m I 6 0.17 3 001 Bad 15 0.43 Come on C 2 0.06 4 0101 It 01000 Really R 000 You know Y 0.11 011

例析2：Huffman编码平均码长：信源的熵： C, η, R = L = 0.03*5+0.17*3+0.43*1+0.06*4+0.03*5+0.17*3 + 0.11*3 = 2.32 信源的熵： H(s) = -(0.03*log2(0.03)+0.17*log2(0.17) +0.43*log2(0.43) + 0.06*log2(0.06)+0.03*log2(0.03) +0.17*log2(0.17) + 0.11*log2(0.11)) = 2.29 C, η, R = 编码前：35×log27 = 98.3, 编码后：81位压缩比：98.3 /81 ≈ 1.213 。 Next Sect...

主要内容编码及信息论概述行程编码 LZW编码霍夫曼编码预测编码变换编码压缩标准简介*

五、预测编码预测编码属于时间域 (Time domain)的编码方法。基本思路：利用前面已经出现过的符号来预测当前的符号，然后将实际上的符号与预测相减得到预测误差值。预测编码的好处在于预测误差值的范围比原信号的数字范围小，如果预测足够精确的话。通常,会对预测误差值进一步编码（Quantization）。可分为有损和无损预测，但预测本身不会造成失真。

五、预测编码 1.无损预测编码(Lossless Predictive Coding) 基本思想去除像素冗余。认为相邻像素的信息有冗余。当前像素值可以用先前的像素值来获得。用当前像素值fn，通过预测器得到一个预测值，对当前值和预测值求差。对差编码，作为压缩数据流中的下一个元素。

五、预测编码例如：利用前1个像素进行预测 100 102 101 103 100 2 -1 1 -2 3 -3 原像素值预测值

五、预测编码预测原理一般情况下，利用前m个像素的线性组合来预测，即预测器为：其中，round为取最近整数，i为预测系数(可为1/m)，y是行变量。注意：前m个像素不能用此法编码，可用哈夫曼编码。

例析：预测编码预测值：

五、预测编码 (2) 编码步骤如Huffman编码预测器设计第①步：压缩头处理。第②步：预测值。第③步：求预测误差值。第④步：对误差e(x,y)编码，作为压缩值。重复执行 ② 、 ③ 、 ④步。

五、预测编码 (3) 编码原理图预测器最接近的整数 + - 符号编码压缩图像输入图像 en fn 

五、预测编码 2. 有损预测编码有损预测编码（Lossy Predictive Coding，LPC）基本概念量化器编码原理

五、预测编码 (1) 基本概念有损压缩：压缩比：有损与无损压缩的本质区别在于有没有量化器模块。通过牺牲图像的准确率来达到增大压缩率的目的。如果容忍解压后的结果中有一定的误差，那么压缩率可以显著提高。压缩比：在图像压缩比大于30:1时，仍然能够重构图像。在图像压缩比为10:1到20:1时，重构图像与原图几乎没有差别。无损压缩的压缩比很少有能超过3:1的（Why ?）。有损与无损压缩的本质区别在于有没有量化器模块。

五、预测编码数据源编/解码的一般模型编码模型映射器量化器编码器解码模型符号解码器反向映射器

五、预测编码 (2) 量化器减少数据量的最简单的办法是将图像量化成较少的灰度级，通过减少图像的灰度级来实现图像的压缩； (2) 量化器减少数据量的最简单的办法是将图像量化成较少的灰度级，通过减少图像的灰度级来实现图像的压缩；这种量化是不可逆的，因而解码时图像有损失。例如：如果输入是256个灰度级，对灰度级量化后输出，只剩下4个层次，数据量被大大减少，但这个过程是不可逆的。

五、预测编码量化器的定义阶梯形量化函数 t = q(s)，是一个s的奇函数（即q(-s) =-q(s)），它可以通过L/2、si和ti来完全描述。 si 被称为量化器的决策级（阈值）； ti 被称为量化器的重构级（代表级）。 L：是量化器的级数。由于习惯的原因，si被认为是映射到ti，如果它在半开区间(si,si+1]。

五、预测编码 s1 s2 t 量化器的定义 t = q(s) t2 t1 s output t(L/2) 重构级(代表级) S-[(L/2)-1] t1 s s1 s2 S(L/2)-1 input 决策级(阈值) -t(L/2) 注：量化的对象可能是负数

五、预测编码 (3)算法演变——无损到有损基本思想：对无损预测压缩的误差进行量化，通过消除视觉心理冗余，达到对图像进一步压缩的目的。 —— 引入量化 (Quantification)

五、预测编码编、解码原理及过程无损预测将en量化：用：近似：编码：解码：

五、预测编码编码流程 + - 符号编码预测器压缩图像输入图像 en fn  量化器 ên

五、预测编码解码流程压缩图像 + + 符号解码预测器解压图像 fn  fn ên

五、预测编码编码方案的修正 fn fn 编码解码预测器预测器 fn fn

五、预测编码编码方案的修正输入图像 fn + - en ên 符号编码压缩图像量化器预测器  fn + + fn

五、预测编码 DPCM简介差分脉冲编码调制(Differential Pulse Code Modulation, DPCM)，采用反馈方法预测估值。 1950年，卡特勒申请专利; 1952年，获得批准; 1958年，格雷厄姆（Graham)开始计算机模拟研究编码方法； 1966年，奥尼尔（O’Neal)对电视信号预测编码进行理论分析以及计算机模拟； 1971年投入使用。

五、预测编码 DPCM编码原理图量化器编码器解码器预测器

五、预测编码量化器预测器 一般是一个小于1的预测系数。

例析：DPCM 例如：量化器设：  = 6.5 ‘e +6.5 e -6.5

例析：DPCM 例如： = 1， = 6.5 计算：两个像素 f0 =14、f1 =15，则： (预测结果) (预测误差) (预测误差) (重构结果) (重构误差)

例析：DPCM 输入编码解码误差 n f ^f e e f ^f f f-f 输入编码解码误差 n f ^f e e f ^f f f-f 0 14 - - - 14.0 - 14.0 0.0 1 15 14.0 1.0 6.5 20.5 14.0 20.5 -5.5 2 14 20.5 -6.5 -6.5 14.0 20.5 14.0 0.0 3 15 14.0 1.0 6.5 20.5 14.0 20.5 -5.5 . . . . . . . . 14 29 20.5 8.5 6.5 27.0 20.5 27.0 2.0 15 37 27.0 10.0 6.5 33.5 27.0 33.5 3.5 16 47 33.5 13.5 6.5 40.0 33.5 40.0 7.0 17 62 40.0 22.0 6.5 46.5 40.0 46.5 15.5

五、预测编码可以是固定的，也可以是自适应的；可以是线性的，也可以是非线性的。预测器设计得越好，对输入的数据压缩就越多。 3. 预测器的一般模型可以是固定的，也可以是自适应的；可以是线性的，也可以是非线性的。预测器设计得越好，对输入的数据压缩就越多。

预测器模型一维线性预测

预测器模型 (1) 最佳线性预测选ak，使σ2d(n)最小。设x(n)是广义平稳的，且e(n)均值为0，则

预测器模型假设x(n)是各态遍历的，且训练样本数N相当大，则x(n)的自相关函数上式写成矩阵形式：

预测器模型 (2) 自适应线性预测若x(n)是非平稳的，或是分段近似广义平稳，则可采用边送数据边测量与估计x(n)的自相关函数，求出相应的最佳预测系数。随之，相应的最佳预测系数随着x(n)的统计特性的变化而变化，这就是自适应线性预测。

预测器模型二维线性预测原始图像用f (m,n)表示：预测的差值定义为：这里Z为对像素f (m,n)进行预测的相关点的集合。

预测器模型方程的解 a1, a2, …, am 是一组最佳的预测系数。压缩效果可用方差σ2e(n)来衡量，即：原始序列相关性越强， R(k)越大，σ2e(n)越小，压缩效果越显著；原始序列互不相关，即R(k) =0，k≠0，则，σ2e(n)= σ2x(n)一点也不能压缩。 Next Sect...

主要内容编码及信息论概述行程编码 LZW编码霍夫曼编码预测编码变换编码压缩标准简介*

六、变换编码 1. 变换编码的基本思想用一个可逆的、线性的变换(如FFT、DCT)，把图像映射到变换系数集合; 对该系数集合进行量化和编码; 对于大多数自然图像，重要系数的数量是比较少的。因而可以用量化(或完全抛弃)，且仅以较小的图像失真为代价。

例析：DCT编码例如： 52 55 61 66 70 61 64 73 63 59 66 90 109 85 69 72 62 59 68 113 144 104 66 73 63 58 71 122 154 106 70 69 67 61 68 104 126 88 68 70 79 65 60 70 77 68 58 75 85 71 64 59 55 61 65 83 87 79 69 68 65 76 78 94 原图像 DCT变换系数

2018/9/18 例析：DCT编码 DEMO dctdemo.m

六、变换编码编码/解码流程图输入图像N×N 压缩图像构造n×n 的子图正变换量化器符号编码器符号解码器逆变换压缩图像解压图像

六、变换编码构造n×n的子图 N n×n n×n n×n n×n N n×n n×n

六、变换编码 2.变换编码的基本原理将FFT逆变换表达式进行改写： F(u,v) 记为：T(u,v) exp[j2(ux+vy)/N] 记为：H(x,y,u,v) 变换编码，即要用等式的右部近似原图像。

六、变换编码——基本理论进一步改写：其中： (1) F是一个包含了f(x,y)的象素的n×n的矩阵； (2) Huv的值只依赖坐标变量x,y,u,v，与T(u,v)和f(x,y) 的值无关，被称为基图像。

六、变换编码——基本理论基图像Huv Huv可以在变换前一次生成，对每一个 n×n的子图变换都可以使用。

六、变换编码——基本理论变换系数截取模板通过定义变换系数截取模板函数，消去冗余。对于：近似： 1 1 1 1 0 0 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 对于：近似：

六、变换编码——基本理论误差评估其中，||F –^F||是矩阵范数，2T(u,v)是变换在(u,v)位置上的系数方差。

六、变换编码——基本理论小结 (1) 总的近似均方误差是丢弃的变换系数的方差之和（也即对于m(u,v) = 0的系数方差之和）。 (2) 能把大多数信息封装到最少的系数里去的变换，可得到最好的子图像的近似，同时重构误差也最小。 (3) 在等式成立的假设下，一个N×N的图像的(N/n)2个子图像的均方误差是相同的。因此，N×N图像的均方误差（平均误差的测量）等于一个子图像的均方误差。

六、变换编码 3. 几个关键问题变换的选择变换的评价子图尺寸选择压缩位分配（编码）

六、变换编码——基本理论变换的选择 (1) Karhunen-Loeve变换（KLT） (2) 离散傅立叶变换（DFT） (3) 离散余弦变换（DCT） (4) Walsh-Hadamard变换（WHT） (5) 离散小波变换（DWT）

六、变换编码——几个关键问题变换的评价按信息封装能力排序： KLT，DCT，DFT，WHT，HaarT KLT的基图像是数据依赖的，每次都要重新计算Huv，因而很少使用。 DFT的块效应严重。 DCT最常用，现已被国际标准采纳，作成芯片。其优点有：1) 基本没有块效应；2) 信息封装能力强，把最多的信息封装在最少的系数中。

六、变换编码——几个关键问题子图尺寸选择一般而言，随着n的增加，块效应相应减少。选择原则：如果n是子图的维数，n应是2的整数次方，便于降低计算复杂度； (2) n一般选为8×8或16×16，具体可由试验得到。一般而言，随着n的增加，块效应相应减少。

六、变换编码——几个关键问题压缩位分配（编码）定义：截取、量化、系数编码统称为位分配。主要解决m(u,v)的设计、编码问题。截取和量化一般有两种方法：子带编码（固定模板）；阈值编码（自适应编码）。

六、变换编码——几个关键问题 1) 子带编码基本思想：所有子图像使用相同的编码模板。 1 1 1 1 1 0 0 0 1 1 1 1 0 0 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 可消去87.5%的系数的模板

六、变换编码——几个关键问题 (a) 大部分的信息包含在方差较大的变换系数中。 (b) 在(N/n)2个子图找出取方差较大的m个系数的位置。每一个DCT变换系数被认为是一个随机变量；该变量的分布可以在所有变换子图像的集合上进行计算。 (b) 在(N/n)2个子图找出取方差较大的m个系数的位置。同时确定系数的坐标u和v；对所有子图像，这m个系数的T(u,v)值是保留的，其他的T值被抛弃； m是一个可选常数。

六、变换编码——几个关键问题算法的实现计算模板：方差较大的地方置1，其它地方置0; 量化系数：如最优Lloyd-Max量化器等; 系数编码：有以下2种二进制位分配方法，即系数被赋予相同数量的二进制位; 系数之间固定地分配一定的二进制位。 8 7 6 4 3 2 1 0 7 6 5 4 3 2 1 0 6 5 4 3 3 1 1 0 4 4 3 3 2 1 0 0 3 3 3 2 1 1 0 0 2 2 1 1 1 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0

六、变换编码——几个关键问题 2) 阈值编码(自适应编码) if a(系数) > T(阈值) m(u,v) = 1 else m(u,v) = 0 由于其简单性，阈值编码是实际应用中经常使用的编码方法。

六、变换编码——几个关键问题理论依据取值较大的变换系数，在重构子图的质量中起的作用也最重要；较大系数的分布随子图的不同而不同。 1 1 0 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

六、变换编码——几个关键问题算法实现 ① 阈值选取，一般按以下3种途径： a. 所有子图使用相同全局阈值。压缩率的大小由大于全局阈值的系数个数所决定。 b. 每个子图使用不同的阈值。每个子图保留的系数的个数事先确定，即总保留N个最大的，称为N-最大化编码。对于每个子图同样多的系数被丢弃。因此，每个子图的压缩率是相同的，并且是预先知道的。

六、变换编码——几个关键问题例如： c. 阈值作为子图系数位置的函数所有子图使用同一个全局阈值模板，但阈值的选取，与系数的位置相关，阈值模板给出了不同位置上系数的相应阈值。 16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 例如：

六、变换编码——几个关键问题 ② 系数编码 zig-zag排序 0 1 5 6 14 15 27 28 0 1 5 6 14 15 27 28 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 10 19 23 32 39 45 52 54 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 63 将系数按45度对角顺序展开成序列，得到有一个有长串为零的序列。例如： -19 -20 5 21 6 0 0 0 0 0 0 0 0 0 用RLE编码对上述序列编码。 zig-zag排序 Next Sect...

主要内容编码及信息论概述行程编码 LZW编码霍夫曼编码预测编码变换编码压缩标准简介*

七、压缩标准简介图像压缩标准静止帧黑白、彩色压缩(JPEG) 连续帧单色、彩色压缩(MPEG) JPEG —— Joint Photographic Experts Group MPEG —— Moving Picture Experts Group

(1) JPEG压缩标准有三种压缩系统： (1)基线编码系统：面向大多数有损压缩的应用，采用DCT变换压缩。 (2) 扩展编码系统：面向递进式应用，从低分辨率到高分辨率逐步递进传递的应用。 (3)独立编码系统：面向无损压缩的应用，采用无损预测压缩，符号编码采用哈夫曼或算术编码。一个产品或系统必须包括对基线系统的支持。

JPEG压缩标准 JPEG压缩流程输入图像压缩图像压缩图像解压图像构造8x8 的子图颜色空间转换零偏置转换 DCT 正变换量化器符号编码器压缩图像解压图像符号解码器 DCT 逆变换颜色空间转换零偏置转换合成8x8 的子图

MPEG1/2/4/7标准 MPEG1/2/4/7标准由ISO/IEC制定的。国际标准化组织 (International Organization for Standardization，ISO) 。国际电工委员会 (International Electrotechnical Commission, IEC) ，正式成立于1906 年，属于非政府性国际组织，是世界上成立最早的专门国际标准化机构。

MPEG1/2/4/7标准简介 MPEG的第一个成果MPEG-1于1992年推出，是VCD的基础。由于有限的352×288像素分辨率，MPEG-1只适用于家庭环境，获得的视频质量及数据率相当低。 1995推出MPEG-2。720×576的像素以及更高的分辨率大大提高了视频质量。 1999年12月发布了MPEG-4。 MPEG-7为多媒体内容描述接口标准。从MPEG组织成立至今，其任务和方向都发生了很多变化。MPEG-1和MPEG-2已经是成熟的编码标准，现在的热点主要集中在MPEG-4 和 MPEG-7上。

MPEG1/2/4/7 MPEG1 编码技术应用范围：视频CD_ROM存储、视频消费。 DCT变换前向、双向运动补偿预测 Zig-zag排序霍夫曼编码、算术编码每15帧至少要有一个I帧编码技术

MPEG1/2/4/7 MPEG2 应用范围：数字电视、高质量视频、有线电视、视频编辑、视频存储。编码技术 DCT变换前向、双向运动补偿预测 zig-zag排序霍夫曼编码、算术编码每15帧至少要有一个I帧编码技术

MPEG1/2/4/7 MPEG4 编码技术应用范围：互联网、交互视频、移动通信。 DCT变换、小波变换前向、双向运动补偿预测 zig-zag排序脸部动画、背景编码霍夫曼编码、算术编码每15帧至少要有一个I帧编码技术

MPEG1/2/4/7 MPEG7 1998年10月被提出，它的正式名称是“多媒体内容描述借口”。其用途非常广泛：即可用于存储(在线或离线)，也可应用于流式结构(如广播、将模型假如Internet)。还可用于实时或非实时环境下。

MPEG-7的应用领域音视数据库的存储和检索；广播媒体的选择（广播、电视节目）；因特网上的个性化新闻服务；智能多媒体；教育领域的应用；远程购物；社会和文化服务；调查服务遥感；监视；生物医学应用；建筑、不动产及内部设计等。

H.261/263/264 H.261/263 H.261/263标准是由CCITT(国际电话与电报咨询委员会)制定的。 CCITT现在被称为 ITU-T(国际标准化组织电讯标准化分部)，是世界上主要的制定和推广电讯设备和系统标准的国际组织.它位于瑞士的geneva。

H.261/263/264 H.261 编码技术应用范围：ISDN视频会议。 DCT变换前向运动补偿预测 zig-zag排序脸部动画、背景编码霍夫曼编码编码技术运动补偿

H.261/263/264 H.263 编码技术应用范围：可视电话。 DCT变换双向运动补偿预测 zig-zag排序脸部动画、背景编码霍夫曼编码编码技术

H.261/263/264 H.264 H.264是ISO/IEC MPEG(运动图像专家组)与ITU-T(视频编码专家组)组成的JVT(联合视频组）提出的新视频编码标准，并于2003年5月确定为国际标准。同时，还作为MPEG-4的PART10(称为为MPEG4 AVC)。

H.261/263/264 H.264 H. 264 视频编解码标准的压缩效率可以达到以往标准(如H. 263 或M PEG-4) 的1.5～2 倍，与H. 263标准相比, H. 264 采用了许多新技术，如对4×4 点残差数据块进行整数变换L采用4×4 点整数变换, 计算复杂度低, 峰值信噪比(PSNR) 却只降低0. 02dB。 will be over…

主要内容编码及信息论概述行程编码 LZW编码霍夫曼编码预测编码变换编码压缩标准简介*

Thank you! Open the next … Optoelectronic Image Processing Curriculum Group 2017.5.16

本章作业 1、已知符号Ａ,Ｅ,Ｉ,Ｏ,Ｕ,Ｖ其出现的概率分别是0.1, 0.4, 0.06,0.1,0.04,0.3,对其进行霍夫曼编码，给出码字、码字的平均长度和编码效率。 2、考虑如下大小为4 ×8的图像： 21 21 95 95 169 169 243 243 (1) 计算该图像的熵； (2) 用霍夫曼压缩该图像； (3)计算用霍夫曼编码能达到的压缩率和效率。

本章作业 3、编程练习：读取一幅512 ×512 ×8比特的单色Lena图像，完成以下步骤：统计该图像的概率直方图，并画出直方图；计算该图像的熵；对其进行霍夫曼编码；分别计算压缩率和冗余度。请使用原图(lena512.jpg)

Terms Image compression:图像压缩 Image coding:图像编码 Encoding: 编码 Decoding: 解码，译码 Cryptography: 密码学 Decompression: 解压 Encoder: 编码器 Decoder: 解码器 Redundant: 冗余的 Irrelevant: 不相干的

Terms Compression ratio: 压缩比 Dictionary-based encoding techniques: 基于字典的编码技术 Statistical encoding method: 统计编码方法 Lossless image compression: 无损图像压缩 Reversible encoding: 可逆编码 Error-free encoding: 无误差编码 Information preserving encoding: 信息保持编码 Encoding model: 编码模型 Information: 信息

Terms Source of messages: 信源，消息源 Memoryless source of messages: 无记忆信源 Memory source of messages: 有记忆信源 Entropy: 熵 Lossy image compression: 有损图像压缩 Fidelity: 保真度 Huffman coding:霍夫曼编码 B code: B码 Shift code: 移位码 Run: 行程

Terms Run length encoding (RLE): 行程编码 Contour encoding: 轮廓编码 LZW algorithm: Lemple-Ziv-Welch编码 Isoprefrence curves: 等值线，等优线 Freeman’s chain code: Freeman链码 Mapping: 映射 Scalar quantization: 标量量化 Rate distortion theory: 率失真理论 Date rate: 数据率 Distortion: 失真度

Terms Rate distortion function:率失真函数 Reconstruction error: 重构误差 Transform image encoding: 变换图像编码 Block encoding: 块编码 Bit allocation: 位分配，比特分配 Differential encoding:微分编码 Predictive encoding: 预测编码 Predictor: 预测器 Predictive coefficient: 预测系数

Terms Differential pulse code modulation (DPCM): 差分脉冲编码调制 Hybrid encoding: 混合编码 Subband coding: 子带编码 Karhunen-Loeve transform: 卡洛变换 K-L transform: 卡洛变换 Singular value decomposition transform: 奇异值分解变换 SVD transform:奇异值分解变换 Eigenvalue: 特征值

Terms Eigenvector: 特征向量 Hartley transform: 哈特雷变换 Haar transform: 哈尔变换 Markov process: 马尔科夫过程 Covariance matrix: 协方差矩阵 Hadamard transform: 哈达玛变换 Walsh transform: 沃尔什变换 Slant transform: 斜变换