多媒体通信原理第2章 数据压缩编码基本理论.

Slides:



Advertisements
Similar presentations
第四章 多媒体数据压缩编码技术 多媒体数据压缩编码技术的重要性和 分类 多媒体数据压缩编码技术的重要性和 分类 量化 统计编码 预测编码 变换编码 多媒体数据压缩编码的国际标准.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
第四章 图像信号数字化 第一节 图像信号及质量评价 第二节 图像信号的数字化 第三节 数字图像编码及几种常见的编码方法
第六章图象数据压缩编码 基本内容 图像压缩基础 无损压缩 有损压缩 静止图像压缩编码的技术标准JPEG.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第5章 图像编码与压缩.
第三章 函数逼近 — 最佳平方逼近.
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
《高等数学》(理学) 常数项级数的概念 袁安锋
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
C++中的声音处理 在传统Turbo C环境中,如果想用C语言控制电脑发声,可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为: Beep(频率,持续时间) , 单位毫秒 暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒 引用这两个函数时,必须包含头文件
指导教师:高新波 学 生:霍菲菲 二零零四年十二月
Hadoop I/O By ShiChaojie.
面向对象建模技术 软件工程系 林 琳.
第六章 图像编码 CHAPTER 6 IMAGE ENCODING §1 基本概念 §2 简单编码方法 §3 预测编码方法
DM8148与DM8127 ISS框架讲解 广州创龙电子科技有限公司
数学模型实验课(三) 插值与三维图形.
第十章 方差分析.
多媒体技术 中南大学信息科学与工程学院 黄东军.
第3章 信息与信息系统 陈恭和.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
本节内容 字符编码 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
数列.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
顺序表的删除.
晶体管及其小信号放大 -单管共射电路的频率特性.
模型分类问题 Presented by 刘婷婷 苏琬琳.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
VisComposer 2019/4/17.
晶体管及其小信号放大 -单管共射电路的频率特性.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
2019/5/4 实验三 离散傅立叶变换的性质及应用 06:11:49.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
多媒体技术 中南大学信息科学与工程学院 黄东军.
音频处理及数字化.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
第4课时 绝对值.
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
第七、八次实验要求.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
2019/5/21 实验一 离散傅立叶变换的性质及应用 实验报告上传到“作业提交”。 11:21:44.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
§2 方阵的特征值与特征向量.
§7.3 离散时间系统的数学 模型—差分方程 线性时不变离散系统 由微分方程导出差分方程 由系统框图写差分方程 差分方程的特点.
滤波减速器的体积优化 仵凡 Advanced Design Group.
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
基于列存储的RDF数据管理 朱敏
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第8章 创建与使用图块 将一个或多个单一的实体对象整合为一个对象,这个对象就是图块。图块中的各实体可以具有各自的图层、线性、颜色等特征。在应用时,图块作为一个独立的、完整的对象进行操作,可以根据需要按一定比例和角度将图块插入到需要的位置。 2019/6/30.
本底对汞原子第一激发能测量的影响 钱振宇
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
第十七讲 密码执行(1).
第十二讲 密码执行(上).
第十章 模糊图像变换编码 学 生:罗龙 二零零六年十二月.
§4.5 最大公因式的矩阵求法( Ⅱ ).
入侵检测技术 大连理工大学软件学院 毕玲.
混沌保密通讯 实验人 郝洪辰( ) 李 鑫( ).
最小生成树 最优二叉树.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
第三章 图形的平移与旋转.
Presentation transcript:

多媒体通信原理第2章 数据压缩编码基本理论

本章主要内容 多媒体数据压缩编码基本原理 几种常见编码 多媒体数据压缩编码的必要性 多媒体数据压缩编码的可行性 压缩编码的理论基础 数据压缩的基本方法 压缩编码算法的性能评价指标 几种常见编码 预测编码;变换编码;统计编码 其他编码…

多媒体压缩技术概述 Why What How Necessities Techniques & Standards ? Why What How Necessities Techniques & Standards Probabilities

2.1 多媒体数据压缩编码基本原理 多媒体数据压缩编码的必要性 多媒体数据压缩编码的可行性 压缩编码的理论基础 数据压缩的基本方法 为什么要压缩,不压缩不行吗? 多媒体数据压缩编码的可行性 为什么可以压缩了,从哪些方面入手压缩? 压缩编码的理论基础 数据压缩的基本方法 压缩编码算法的性能评价指标

2.1.1 多媒体数据压缩编码的必要性 多媒体处理中涉及使用到各种媒体,会带来巨大的数据量。 从存储和传输两个方面考虑,这样巨大的数据量都会带来实现上的困难。 举例说明: (1)存储量: 一幅图像,空间分辨率为640×480,颜色编码方式为真彩色,存储这样一幅未经压缩的图像需要的存储量为: 640×480×24/8=921,600B

多媒体数据压缩编码的必要性 从上面两个例子可以看出,未经压缩的媒体数据直接存储或传输,在目前的技术水平和实现成本上考虑都是不可行的。 (2)传输带宽: 由网络传输未经压缩的视频信号(设每帧画面分辨率均为640×480,24真彩色,且每秒30帧),将需要的传输带宽为: 640×480×24×30≈0.221Gb/s 从上面两个例子可以看出,未经压缩的媒体数据直接存储或传输,在目前的技术水平和实现成本上考虑都是不可行的。

多媒体数据压缩编码的必要性 所以,压缩的目的是为了满足存储容量和传输带宽的要求。 适当的多媒体数据压缩编码可以实现较低的时延和高的压缩比,为多媒体技术的实现提供可能。 压缩编码要求数据量尽量低,但又要保证解码质量。

2.1.2 多媒体数据压缩编码的可行性 压缩的可行性(可能性)存在于:多媒体数据之间具有很强的相关性,即数据间具有冗余性。 多媒体数据常见的冗余性包括: 1.空间冗余性 -如:图像中常见一些规则形状的物体 -如:图像中通常相邻的一块面积上像素值基本相同

空间冗余度

多媒体数据压缩编码的可行性 2. 时间冗余性 -如:视频序列中相邻两帧画面的内容通常都非常接近 -如:音频序列中相邻两个采样值非常接近 3.其他一些冗余性: -结构冗余性 -知识冗余性 -视觉冗余性 -听觉冗余性

时间冗余度

人眼的视觉特性 对图像的边界和轮廓比对图像内部的内容更敏感 对图像中的亮度分量比对色度分量更敏感 对低频分量比对高频分量更敏感 眼睛具有视觉误差,由此才可以产生视频 两只眼睛具有视角差,由此产生出3维图像

多媒体数据压缩编码的可行性 信源数据等于信息量和信息冗余量之和。去除这些冗余量,只保存或者传输有用的信息量,则可以在保证语音、数据和视频质量的前提下,实现数据的有效压缩。

2.1.3 多媒体数据压缩编码的理论基础 数据压缩的理论基础为Shannon信息论。它一方面给出了数据压缩的理论极限,另一方面又指明了数据压缩的技术途径。 Shannon理论内容: 设信息源X的符号集为xi (i=0,1,2,…,N), xi 出现的概率为p(xi ),则信息源X的熵定义为 其中,H(X)的单位为bit,-log2p(xi)表示包含在xi中的信息量。

多媒体数据压缩编码的理论基础 Shannon理论认为:信源中所含有的平均信息量(熵)是进行无失真压缩编码的理论极限。 如果设计的编码方法的码字平均长度最接近熵,则说明该编码方法是最佳的。 例如:某信源 则此信源的熵为: 说明该信源编码平均长度最短的情况下为7/4。

2.1.4 多媒体数据压缩编码的基本方法 从是否能无失真地恢复被压缩编码的信息出发,可以将数据压缩分为两大类: 1.无损压缩(冗余度压缩,信息保持编码,熵编码) 被压缩的信息能无失真地恢复回来。 2.有损压缩(信息量压缩,失真度编码,源编码) 被压缩的信息在恢复回来后,与压缩之前的信息不是完全一样,有一定的损失。

多媒体数据压缩编码的基本方法 无损压缩特点: 仅仅将被压缩的媒体数据看成是一串没有任何物理意义的数据,消除它们的空间和时间上的相关性。 解码后可以完全恢复出数据,没有任何损失。 压缩比率通常比较低,一般为2:1~5:1。 常用于文本数据和特殊场合(需要保持恢复数据质量)的图像数据。 常见方式:游程(Run-length)编码,Huffman编码,算术编码等。

多媒体数据压缩编码的基本方法 有损压缩特点: 在了解被压缩的媒体数据的物理含义,并结合人的感官特性基础上,消除数据间相关性和去掉人们不敏感的频率分量而得到的压缩编码。 由于在编码中去掉了一些人们不敏感的分量,会造成在解码时可以不能完全恢复出数据,因此是有损编码。 压缩比率通常比较高。 常用于重构信号不一定要求和原始信号完全相同的场合。 常见方式:预测编码,变换编码,子带编码等。

2.1.5 压缩编码算法的性能评价指标 数据压缩编码算法的评估指标包括: 一个好的算法还要考虑: 压缩比 保真度 算法复杂性 时延 多媒体系统的软、硬件适应能力。 应用环境 技术标准……

压缩编码算法的性能评价指标 压缩比: 保真性: 压缩比=压缩前数据量/压缩后数据量 理论上讲,在保证压缩后图像质量的前提下,压缩比越高越好。 真是一个对压缩质量进行评价的参数,分为主观保真度和客观保真度。 客观保真度用重建信号质量与原信号之间的均方误差来衡量: xi和xi’分别对应原信号和重建信号,N2为总信息数量。

压缩编码算法的性能评价指标 保真性: 客观保真性:将均方误差作为由数据压缩而产生的噪声能量,定义压缩信噪比为 主观保真性:在规定的观测条件(图像尺寸、对比度、亮度、观测距离等)下,对一组标准图像压缩前后的质量进行对比的主观评定标准。具体做法是对重建信号的特性进行按等级评分,然后根据下式计算平均分MOS: 其中,k为级别数,ni为该类别的人数,ci为分数。

2.2 预测编码 预测编码的基本思想: 本方法之依据: 分析信号的相关性,利用已处理的信号预测待处理的信号,得出预测值;然后仅对真实值与预测值之间的差值进行编码处理和传输。 本方法之依据: 媒体(如声音,图像等)数据的相邻采样值都非常接近,即具有很强的相关性。利用相邻采样值间的相关性进行预测,可以实现很高的编码效率。

预测编码 预测编码是一种有损编码。因为它的实现是基于声音或图像数据的物理特性--当采样间隔很密时,相邻采样点之间取值非常接近。 预测编码利用数据间存在的时间相关性(声音数据)或空间相关性(图像数据)进行数据压缩。

预测编码举例 30fps 15fps subsampling interpolation 时域

预测编码举例 当前帧 差分帧 + - 下一帧

预测编码举例

2.2.1 脉冲编码调制(PCM) PCM编码是最基本的一种模数转换方法,实现步骤为: 采样:时间轴上的信号离散化 量化:在幅度轴上对信号离散化 编码:按一定格式记录采样量化后的数字数据 T t n g[n] t 量化 t

脉冲编码调制(PCM) 量化技术: 分为标量量化和矢量量化。 每种量化又可分为:均匀量化、非均匀量化、自适应量化。 标量量化:对采样数据逐个进行量化。 矢量量化:对采样数据进行分组,每组K个数构成一个K维矢量,然后以矢量为单位,逐个对矢量进行量化。 均匀量化:量化步长相同的量化。 非均匀量化:量化步长不相同,随 不同情况而改变的量化。 自适应量化:量化步长对应特定问题自适应变化。

脉冲编码调制(PCM) 量化目标包括: 给定量化分层级数,满足量化误差最小。 限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。 PCM编码方式是最早研制,且应用最广泛的一种编码方法。但其压缩比率不是特别高,比如语音信号使用PCM方式压缩出来的数据速率为64Kbit/s。

2.2.2 差分脉冲编码调制(DPCM) DPCM是对PCM的改进,利用了相邻样本值非常接近的特点,在对它们进行编码时,可以去掉它们之间的相关性进行有效的信息传递。 基本思想:根据已处理的样本值估算待处理信号的幅度大小,即预测值,然后对实际信号值与预测值之差进行量化再编成PCM码传输,接收端再将此差值与预测值相加,重建原始信号。

差分脉冲编码调制(DPCM) 具体处理过程参见下图: 量化器 预测器 d(k) s(k) + I(k) sr(k) se(k-1) PCM样本k + I(k) sr(k) se(k-1) se(k) - z-1

差分脉冲编码调制(DPCM) d(k)是离散输入信号s(k)与预测器输出的估算值se(k)之差。 I(k)是对差值d(k)进行量化编码以减少冗余得到的编码值。 sr(k)为重构信号,是由量化差分信号I(k)与前一个时刻的预测值se(k-1)之和,作为确定下一个信号估算值的输入信号。 se(k)为将sr(k)作为输入得到的预测输出。

差分脉冲编码调制(DPCM) 差分脉冲编码调制的优点: 对实际值和预测值之差进行量化编码,则存储或者传送的不是绝对幅度值,由于数据采样值间相关性较强,这些样点值间的差值比实际样本值小很多,所以降低了数据量,也就降低了对传输信道容量的要求。

2.2.3 自适应差分脉冲编码调制(ADPCM) ADPCM是在DPCM的基础上发展起来的,它是利用了线性预测的高效编码模式。 基本思想: 2.采用自适应预测技术估算待处理的输入样本预测值,使实际样本值和预测值之间的差值尽量小。

自适应差分脉冲编码调制(ADPCM) 具体处理过程参见下图: 差分量化器 量化阶调整 逆量化器 预测器 + - 预测PCM样本 PCM样本

自适应差分脉冲编码调制(ADPCM) ADPCM的设计思路: 质量: 适用场合: 1、尽可能从语音信号中消除冗余。 2、对消除冗余后的信号,以明显而离散的方式,从自适应角度进行最佳编码。 质量: 在保证质量情况下,可以将64Kbit/s的数据压缩到32Kbit/s或16Kbit/s,甚至8Kbit/s、2.4Kbit/s、0.8Kbit/s。 适用场合: 用于资源受限的通信系统,如蜂窝无线通信系统。

2.3 变换编码概述 变换编码的基本思想: 本方法之依据: 利用各种变换手段,将信号从一个域变换到其正交空间中去,用变换系数来表示原始媒体数据,并对变换系数进行编码,往往这个时候,变换系数都具有很容易压缩的特性。 本方法之依据: 很多媒体信号在某个域(如时间域或空间域)特性并不明显,而变换到变换域(如频域)去则可以得到很好的压缩处理效果。

变换编码概述 变换编码要可用,必须要求其反变换存在。 变换编码示意图: 另外一个域的数据 编码/解码 某个域的数据 严格来说,当反变换存在时,变换编码是一种无损编码。但是在实现时,基于数字系统的精度有限,无法无失真地表示每个变换系数,所以它其实是有损的。

变换编码概述 变换域编码的优点: (1)在变换域里视频图像要比空间域里简单。 (2)视频图像的相关性明显下降,信号的能量主要集中在少数几个变换系数上,采用量化和熵编码可有效地压缩其数据。 (3)具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于预测编码。

2.3.1 正交变换 假设一个离散信号由N个采样值组成,即一个N维向量,而每个采样值代表N维信号空间中数据向量X的一个分量。正交变换就是为了寻找一个变换矩阵T,使得可以利用M维矩阵Y来近似表示X: Y=TX 利用子集Y来恢复X时,不会引起明显的误差。 再对Y中的M个分量进行压缩,即可达到压缩的目的。

2.3.2 离散傅立叶变换(DFT)和离散余弦变换(DCT) 其中,WNk为旋转因子, WNk=e-j2π/N.

离散傅立叶变换(DFT) 离散傅立叶变换将时域离散周期的序列映射成频域离散周期的序列,如右图所示。

离散余弦变换(DCT) 离散余弦变换是DFT的一种特殊形式,当基函数为离散余弦函数时,DFT就成为了DCT。 离散余弦变换主要用于图像压缩编码,基本方法是先将整体图像分成N×N像素块,然后对N×N像素块逐一进行DCT变换。变换后得到像素块的频率系数矩阵,其中对应的高频成分系数通常为零,而低频成分系数有较小的值。

离散余弦变换(DCT) 离散余弦变换分一维DCT和二维DCT: (1)一维DCT为: C(u)为变换系数 f(x)为长度为N的序列,F(u)也为长度为N的序列。

离散余弦变换(DCT) (2)二维DCT为: 为变换函数。

2.3.3 子带编码 子带编码的基本思想是把一个声音或图像的傅里叶频谱分解(析)成若干个互不重叠的子频带,所有子带的带宽和仍为原信号的总频带。 子带编码是一种以信号频谱为依据的波形编码方法,它首先用一组带通滤波器将输入信号按频谱分开,然后让每路子信号通过各自的自适应PCM编码器(ADPCM)编码,经过分接和解码再复合成原始信号。

子带编码 子带编码原理参见下图: BPF1 BPF2 BPFx 编码器 … 复 合 器 分 解 译码器 BPFN x[n] x’[n]

子带编码 子带编码的种类: 子带编码的优点: (1)等带宽子带编码:各子带的带宽ΔW是相同的。 (2)变带宽子带编码:各子带的带宽不相同。 (1)每个子带独立自适应,可按每个子带的能量调节量化阶; (2)可根据各个子带对感觉的作用大小共同设计最佳的比特数; (3)量化噪声都限制在子带内,某一频带的量化噪声不会串到另一频带中去。

2.4 统计编码 统计编码的基本思想: 本方法之依据: 对于无记忆的信源,根据码字出现的概率分布特性寻找概率与码字长度间的最优化匹配,据此对信息进行压缩。 本方法之依据: 根据消息出现概率的分布特性而进行的压缩编码,其目的在于在消息和码字之间找到明确的一一对应关系,以便在恢复时能够准确无误地再现出来,或者至少是极相似的找到相当的对应关系。

统计编码 统计编码是一种无损编码,常用于图像、文档等要求无损失的压缩中。 实现原理:有些媒体(如图像,文档)数据中各样点值的出现概率在编码前可以统计出,结合其出现概率进行的编码可以充分降低数据量,同时又保证了媒体的质量。 由于在编码过程中仅仅将这些媒体数据看成是一串数据,没有深入到其物理意义中去研究,所以压缩比率并不高。

2.4.1 霍夫曼编码 基本思想: 对于出现概率较大的符号取较短的码长,而对概率较小的符号则取较长的码长。 霍夫曼编码(Huffman Encoding)又称变长度编码,或最优编码,即遵照霍夫曼编码原则的结果一定是平均码长最短。 霍夫曼编码的特点:只适用于有限个离散信源;且实现起来相当复杂。

霍夫曼编码 编码方法:按照一定的顺序构建二叉树。 举例说明: 假设给定一个4×4的像素块 如右图所示: 1 5 3 4 2 6 试计算其中各像素的霍夫曼编码。 编码过程如下: 第一步:将信源中各符号的概率计算出并按从大到小排序。 Source B=2 A=1 E=5 C=3 F=6 D=4 Probability 5/16 3/16 2/16 1/16

霍夫曼编码 第二步:基于上面的概率分布表构建二叉树 1.将两个出现概率最小的消息合并成一个消息,然后重新按信源符号出现的概率从大到小排列。 2.重复上面步骤1,直到得到的合并消息概率为1。 3.将被合并的两个消息分支分别赋值“0”和“1”,就得到二叉树。 B(5/16) A(3/16) E(3/16) C(2/16) F(2/16) D(1/16) 3/16 5/16 6/16 10/16 16/16 1

霍夫曼编码 第三步:根据构建的二叉树,由树根到每个树叶的所有比特就构成对应信源符号的编码。 A B C D E F 00 10 110 source A B C D E F code 00 10 110 1111 01 1110 Code-length 2 3 4 average length 2.5bits/pixel Compression ratio 2.5/3≈0.833

霍夫曼编码 霍夫曼编码中几个值得注意的问题: 1.由于一个节点的上下两个分支即可以赋值“0”,也可以赋值“1”,因此同一信源对应的霍夫曼编码并不唯一,但平均码长是相同的。 2.霍夫曼编码为唯一可译码,即码的任意一串有限长的码符号序列只能被唯一译成所对应的信源符号。 3.霍夫曼编码不具有检错和纠错的能力,如果码串中有错误,都会导致该码译错,甚至产生误码扩散。

霍夫曼编码 4.霍夫曼是可变长度码,必须在存储代码前先进行译码。 5.霍夫曼对不同的信源,其编码效率是不同的。当信源概率分布很不均匀时,霍夫曼码会具有显著效果。 6.如果信源的实际概率模型与构码时所假设的概率模型有差异,实际的平均码字将大于预期值,编码效率将下降。这种情况下,唯一的解决办法就是更换码表,使之与实际概率模型匹配。

2.4.2 游程编码 基本思想: 游程编码又称为行程编码(Run-length Encoding),也是一种常用于文档和图像中的编码方式。 将数据流中连续出现的字符或像素值用该符号加出现次数来表示。 游程编码又称为行程编码(Run-length Encoding),也是一种常用于文档和图像中的编码方式。 RLE编码简单直观,编码/解码速度快,因此许多图形和视频文件,如BMP、TIFF及AVI等格式文件的压缩均采用此方法。

游程编码 编码方法: 基本的游程编码就是在数据流中直接用三个字符来表示,其数据结构如图所示: Cc X Sc 数据量 其中,Sc表示一个字符串在此位置,X代表构成串的字符,Cc代表串的长度。 例:字符串AAABCDDDDDDDDBBBBB,游程编码结果为3ABC8D5B.

游程编码 优点: 缺点: 1、编码方式简单,直观。 2、译码和编码采用相同的规则进行,得到与压缩完全相同的数据,从而可以实现无损压缩。 1、在特定情况下,如单一颜色背景下的图形图像压缩中可以取得较高的压缩比;而对于复杂颜色的图形图像,则压缩比较低。 2、由于其在压缩实现过程中未考虑被压缩数据的物理含义,所以获得的压缩比也较低。

游程编码 游程编码分类: (1)一维游程编码:常用于文档,声音和图像的无损编码中。例如图像中一维游程编码是对图像进行逐行扫描,旨在消除每行像素(或水平分解元素)的相关性而没有考虑行间像素(或垂直分解元素)的相关性。 (2)二维游程编码:常用于图像编码中,需要考虑每行像素和行间像素两个方向的像素相关性。

2.4.3 算术编码 基本思想: 类似于Huffman编码,对概率较大的符号采用短码,对概率较小的符号采用长码,但Huffman编码只能使用整数比特,而它可以利用分数比特逼近于信源。 基本原理: 1、根据信源中出现不同符号序列的概率不同,把[0,1)区间划分为互不重叠、宽度恰好是各符号序列的概率的子区间。 2、信源中的各符号序列将可用各子区间中的任意一个实数表示,这个数就是该符号所对应的码。

算术编码 算术编码步骤: 分类: 1、建立信源概率表。 2、扫描信源发出的符号序列,对其进行编码。 1、静态算术编码:信源符号概率是固定的算术编码。 2、自适应算术编码:信源符号概率是动态变化的算术编码。

算术编码 举例说明静态算术编码: 假设信源符号为{00,01,10,11},这些符号概率分别为{0.1,0.4,0.2,0.3}。 根据这些概率,可把间隔[0,1)分成4个子间隔: [0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1)。 如果二进制消息序列的输入为:10 00 11 00 10 11 01 编码过程:第一个符号为10,它的编码范围对应[0.5,0.7)而第二个符号00对应的编码范围是[0,0.1)。因此,它的间隔就取[0.5,0.7)的第一个1/10作为新间隔[0.5,0.52)依此类推……

算术编码 自适应算术编码: 首先假定各符号概率的初始值相同,然后其概率根据出现的情况做相应的改变。 自适应模式可以不预先定义概率模型,但要求编码器和译码器使用相同的概率模型。 自适应算术编码的编码效率很高,当信源符号概率比较接近时,可优于Huffman编码。 具体编码过程略。

2.5 其他编码 随着信号处理技术的发展,很多新的编码技术出现并发展 。 常见的新编码技术有: 基于模型的编码 神经网络编码 小波编码 分形编码 混合编码等

2.5.1 基于模型的编码 基本思想:采用分析和合成的方法,先对数据的结构和特征进行分析,提取图像的特征,并用某种模型进行描述,得到模型的参数。 编码之后的数据仅包含媒体对象的特征参数,因此,可以通过对这种编码方式大大减少数据量。 解码时,根据模型的参数和模型的先验知识重构出图像。

基于模型的编码 基于模型的编码原理如下图: 运动估计表示分析模型调整 图像合成图像生成(背景等) 存储 传输 输出 视频 输入 源模型

2.5.2 神经网络编码 基本思想: 编码方法: 神经网络编码的特点: 利用人类神经系统的工作原理来模拟非线性变换以及难以用模型描述的变换编码。 编码方法: 利用神经网络处理技术来实现。 神经网络编码的特点: 1.优点:采用并行分布处理;具有固有的非线性特性;具有强的适应性和信息的融合能力。 2.缺点:训练时间过长,局部极小等问题。

神经网络编码 人工神经网络(ANN)的基本原理: 受生物大脑的启发,试图模仿人脑神经系统的组成方式与 思维过程而构成的信息处理系统,具有非线性、自学习性、容错性、联想记忆和可以训练性 等特点。ANN模型的处理能力主要由网络的拓扑结构和网络节点的功能所决定。理论上已 证明,只要具有一个隐层的ANN网络即可实现对任意实值的逼近,实现任何非线性映射。

2.5.3 小波编码 基本概念: 它是傅立叶变换的发展,有效的解决了许多傅立叶变换无法解决的问题,如精确分析突变信号和非平稳信号等。其最常用于图像编码中。 基本思想: 将原图像分解成不同的频率区域,用持续的压缩编码方法根据人的视觉、图像的统计、细节和结构等特征,对不同的频率区域采用不同的压缩编码手段,从而减少数据量。

小波编码 特点: 优点: 是多分辨率分析、时-频分析和子带编码的一种统一方法。 利用小波变换压缩图像,特别适合人眼的视觉特性,同时利于图像的分层传输。 优点: 运算速度快 实现方便 压缩质量好

小波编码 具体步骤: 首先进行图像小波分解,将一幅图像经过小波变换分解为一系列尺度(频率)、方向、空间局部变化的子带。 然后在不同频率分辨率层上采用不同的码字长度进行编码。编码中根据不同分辨率要求,压缩不必要的小波系数,从而达到压缩编码的目的。 注意:根据不同的信源情况,还可以选择不同的小波变换,进行自适应小波分解。

2.5.4 分形编码 基本思想: 利用分形来描述几何形状,其中的不规则细节可以不同的尺度和角度重复出现,这些尺度和角度可以用分形变换加以描述。 基本原理: 分形定义为“一种由许多个与整体有某种相似性的局部所构成的形体”。分形概念的提出及分形几何学的创立为描述客观世界提供了更准确的数学模型。

分形编码 基本原理: 图形学是几何学的延伸与发展,分形模型研究成果的积累形成了新的图像学分支——分形图像学。而基于分形的图像编码方法实质是对图像中一个或多个相对大的部分施行压缩变换来逼近图像的每一部分。 1990年,A.Jacquin提出了全自动的可行的分形压缩编码方法,由于其可以获得极高的压缩比而得到广泛关注。

分形编码 编码压缩过程: 1、把原始图像分成互不重叠的定义域块(Range块),这些块能将原始图像全部覆盖,每一个Range块大小均为B×B;每一Domain块的大小均为D×D,且通常D=2B。 2、为使压缩后重构图像的质量更好,相邻 的Domain块之间在水平及垂直方向均有重叠,水平及垂直方向上位移量为B。依次对每一个Domain块中相邻的4个灰度值求平均,于是每一个大小为D×D(2B×2B)的Domain块就变成了大小为B×B的Sub_Domain块。

分形编码 编码压缩过程: 3、利用最小二乘法,并配合八种对称变换算子,将收缩后的Domain块(Sub_Domain块)与Range块进行匹配运算。 4、若计算出的MSE小于给定误差,则认为匹配成功,否则继续匹配,在找到最佳值域块及仿射变换后,需要存储其参数以便传输。 5、这些参数包括:匹配成功的Domain块块号、Jacquin变换算子的编号以及比例因子S、偏移量O。

2.5.5 混合编码 混合编码是采用两种或多种编码方法进行的压缩编码。 常见混合编码: 1.变换编码与DPCM编码结合 2.分形编码与小波变换结合 3.分形编码与DCT变换结合 4.分形编码与向量量化结合 5.变换编码、量化编码及游程编码结合…

混合编码 混合编码常常是一些多媒体编码标准使用的编码方式,如: 混合编码的有关研究工作在很多方面还存在不完善之处,需要进一步探讨和研究。 (1)JPEG:变换域编码+量化编码+游程编码+Huffman编码 (2)MPEG:变换域编码+量化编码+游程编码+Huffman编码+预测编码… (3)H.261:同MPEG 混合编码的有关研究工作在很多方面还存在不完善之处,需要进一步探讨和研究。

本章小节 多媒体数据压缩的必要性 多媒体数据压缩的可能性 多媒体数据压缩的理论依据 多媒体数据压缩的具体技术 1、无损压缩 2、有损压缩 3、混合编码

课后练习 试讨论多媒体数据压缩的可能性存在于什么地方? 试列表归纳常见的有损编码、无损编码及混合编码方式。 请论述预测编码的基本原理,以及相关改进途径。 现有8个待编码的符号A0~A7,其概率分别为0.3,0.1,0.25,0.15,0.05,0.1,0.03,0.02,使用Huffman编码算法求出这8个符号所分配的代码。 请分析并比较算术编码与Huffman编码。 以小波编码和分形编码混合为例,说明混合编码。