Presentation is loading. Please wait.

Presentation is loading. Please wait.

第二章 多媒体数据压缩编码技术.

Similar presentations


Presentation on theme: "第二章 多媒体数据压缩编码技术."— Presentation transcript:

1 第二章 多媒体数据压缩编码技术

2 第二章 多媒体数据压缩编码技术 2.1 多媒体数据压缩基本原理 2.2 数据压缩与解压缩常用算法 2.3 多媒体数据压缩常用标准

3 2.1.1 数据压缩的必要性与可能性 2.1.2 数据冗余的基本概念和种类 2.1.3 图像压缩预处理技术 2.1.4 量化及其质量
2.1 多媒体数据压缩基本原理 2.1.1 数据压缩的必要性与可能性 2.1.2 数据冗余的基本概念和种类 2.1.3 图像压缩预处理技术 2.1.4 量化及其质量 2.1.5 数据压缩算法综合评价指标

4 数据压缩必要性 图像: 一张640×480真彩(24位)的图像需: 640×480×24=7372800(bit)=900KB
2.1.1 数据压缩的必要性与可能性 数据压缩必要性 数据量大 B G R 图像: 一张640×480真彩(24位)的图像需: 640×480×24= (bit)=900KB (1Byte=8bit) 相当于约46万汉字

5 数据压缩必要性 很难满足计算机处理多媒体的要求 2.1.1 数据压缩的必要性与可能性 数据量大 视频:
以这样的图像构成视频,以每秒30帧进行播放,所需数据量为: ×30≈26.37MB 一张650MB(5200Mb)的光盘 只能存储约25秒的视频节目 很难满足计算机处理多媒体的要求

6 数据压缩必要性 很难满足计算机处理多媒体的要求 2.1.1 数据压缩的必要性与可能性 数据量大 音频:
以44.1KHz采样频率,量化为16bit双通道立体声,每秒数据量为: 44100×16×2= (bit)≈172.3KB 一张650MB的光盘能存放: 650×1024/172.3≈64分钟 很难满足计算机处理多媒体的要求

7 数据压缩的可能性 2.1.1 数据压缩的必要性与可能性 数字化的多媒体数据可以进行数据压缩是基于两种事实
信息的冗余度:多媒体数据中存在大量的冗余,如:300…00(后跟100个0),可以表示为30(100),表示3后跟100个0,从而避免大量的重复0。(科学记数法) 数据(文字、图形、声音、视频等)在计算机中都是以 二进制值0、1来表达、存储和传输,其数值之间有空 间相关和时间相关性。利用相关性可以进行压缩。

8 数据压缩的可能性 2.1.1 数据压缩的必要性与可能性 数字化的多媒体数据可以进行数据压缩是基于以下两种事实
人的视觉及听觉等感官特性 视觉特征表现为对亮度信息很敏感而对边缘的急剧变化不敏感 听觉特征表现出对部分音频信号不敏感,如人的听觉具有一个强音能抑制一个同时存在的弱音现象,而且人耳对低频端比较敏感,而对高频端不太敏感 因此,完全可以利用这些特性去除一些多余及不敏感的信息,从而实现对数据的压缩

9 数据冗余的基本概念 2.1.2 数据冗余的基本概念与种类 多媒体数据的数据量远远大于其所携带的信息量
数据冗余的基本概念与种类 数据冗余的基本概念 多媒体数据的数据量远远大于其所携带的信息量 例:180个汉字,文本数据量为360B。广播员朗读使用1分钟,数字化时采样频率8000Hz,单声道,8为量化,则数据量为8000X60=480KB。可见,传递同样信息,语音数据有1300倍冗余 数学描述:I=D-du I:信息量 D:数据量 du:冗余量

10 I(x)= log2N= - log2 = - log2p(x) 1 N
数据冗余的基本概念与种类 数据冗余的基本概念 复习——信息量 指从N个相等的可能事件中选出一个事件所需要的信息度量和含量 复习——信息熵 信源平均信息量 I(x)= log2N= - log = - log2p(x) 1 N H(x) = H(p(x1),(p(x2), …,p(xn)) = - ∑p(xi) ×log2p(xi) i=1 n n为数据或码元的个数,p(xi )为码元xi 发生的概率

11 数据冗余的基本概念 2.1.2 数据冗余的基本概念与种类 为使单位数据量D接近或等于H,应
数据冗余的基本概念与种类 数据冗余的基本概念 为使单位数据量D接近或等于H,应 其中b(x i)为分配给码元x i 的比特数。理论情况下,应取 但实际上很难确定各码元的概率,因此,一般总取 b(x1)= b(x2)= ...= b(x n),即分配给每个码元的比特数相等(等长码),这样所得的D必然大于H,从而形成了信息冗余。例如, 英文字母编码码元长为7bit, 这样d必然大于H, 由此带来的冗余称为信息熵冗余或编码冗余

12 A 数据冗余的类别 2.1.2 数据冗余的基本概念与种类 空间冗余 时间冗余 图像数据中,大量的相邻像素完全一样或十分接近
数据冗余的基本概念与种类 数据冗余的类别 空间冗余 图像数据中,大量的相邻像素完全一样或十分接近 时间冗余 时间类媒体中经常存在地冗余 相邻两帧的大部分数据无变化,只有少量数据变化 A A

13 数据冗余的类别 2.1.2 数据冗余的基本概念与种类 结构冗余:图像由有规律的图案组成 信息熵冗余:数据携带的信息量少于数据本身
数据冗余的基本概念与种类 数据冗余的类别 结构冗余:图像由有规律的图案组成 信息熵冗余:数据携带的信息量少于数据本身 视觉冗余:由人的视觉特性所产生的冗余,人的视觉系统一般的分辨能力约为26灰度等级,而图像量化一般采用28灰度等级,这样的冗余就称为视觉冗余

14 数据冗余的基本概念与种类 数据冗余的类别 知识冗余:图像的记录方式与人对该图像的知识之间的差异而产生。例如 人脸的图像就有固定的结构,鼻子位于脸的中线上,上方是眼睛,下方是嘴等。我们可以构造其基本模型,并创建对应各种特征的图像库,进而图像的存储只需要保存一些特征参数,就可以大大减少数据量 其他冗余:如图像的空间非定常特性所带来的冗余

15 图像数据压缩的任务是在不影响或少影响图像质量的前提下,尽量设法减少图像数据中的数据量
图像压缩预处理技术 图像数据压缩的任务是在不影响或少影响图像质量的前提下,尽量设法减少图像数据中的数据量 图像数据中存在各种冗余,数据压缩的首要任务就是去除各种冗余数据。当然删除冗余数据必然会给图像质量带来一定的损失,这就需要进行相应的预处理,来保证将这种损失降至最低限度

16 图像压缩预处理技术 图像预处理采用的主要技术 二次抽样 滤波器 量化 预测编码 运动补偿 变长码 图像内插法

17 量化 2.1.4 压缩编码中的量化及其质量 从模拟信号到数字信号的量化 压缩编码中的量化 量化方法
压缩编码中的量化及其质量 量化 从模拟信号到数字信号的量化 压缩编码中的量化 以PCM码为输入,在量化器经过某种变换后输出 存在量化误差 量化方法 标量量化 矢量量化

18 量化 2.1.4 压缩编码中的量化及其质量 量化方法——标量量化
压缩编码中的量化及其质量 量化 量化方法——标量量化 对经过映射变换后的数据或PCM数据逐个进行量化,在这种量化中,所有采样使用同一个量化器进行量化,每个采样的量化都与其他采样无关,也称为零记忆量化 包含均匀量化和非均匀量化两种 均匀量化 非均匀量化

19 量化 2.1.4 压缩编码中的量化及其质量 量化方法——矢量量化
压缩编码中的量化及其质量 量化 量化方法——矢量量化 是近年来发展起来的一种新的编码方法,是一种有损的编码方案,其主要思想是先将输入的语音信号按一定方式分组,再把这些分组数据看成一个矢量,对它进行量化。每组形成的矢量看成一个元素,又叫码字,这些码字排列起来,就构成了一个表(码表),这样在接收端放置同样的码表,当接收到码字的下标信息后,就可以通过查表的到码字信息 此方法以输入矢量与选出的码字之间失真最小为依据,与标量量化相比,它有更大的数据压缩比。但其关键问题是设计一个良好的码本

20 压缩倍数 2.1.5 数据压缩算法综合评价指标 也称压缩率,有两种衡量方法 方法一:压缩前后总的数据量之比
数据压缩算法综合评价指标 压缩倍数 也称压缩率,有两种衡量方法 方法一:压缩前后总的数据量之比 例如:1024X768黑白图像,每像素8bit,将其分辨率降为512X384,再压缩使每像素用0.5bit,则其压缩倍数为64倍,压缩比为1:64 将任何非压缩算法产生的效果(如降低分辨率、帧率等)排除在外,用压缩后的比特流中每个显示像素的平均比特数来表示 例如:以15000字节存储一幅256×240的图像,则压缩率为(15000×8)/(256×240)=2比特/像素

21 图像/音频质量 2.1.5 数据压缩算法综合评价指标 评估解压缩后所得数据的质量,常采用客观评估和主观评估两种方法
数据压缩算法综合评价指标 图像/音频质量 评估解压缩后所得数据的质量,常采用客观评估和主观评估两种方法 客观评估:是通过一种具体的算法来统计多媒体数据压缩结果的评估方法,常使用信噪比来评价 主观评价:由人主观进行打分以进行评价。具体做法是:由若干人(一般分专业组、非专业组)对所观测的重建图像的质量按很好、好、尚可、不好、坏五个等级评分,然后计算出平均分数MOS,一般MOS4分以上即为可收费标准

22 图像/音频质量 2.1.5 数据压缩算法综合评价指标 解压缩后所得数据的质量还与压缩时所采用的压缩方法相关
数据压缩算法综合评价指标 图像/音频质量 解压缩后所得数据的质量还与压缩时所采用的压缩方法相关 无损压缩:压缩后的数据经解压缩还原后与原始数据完全相同,压缩倍数不大 有损压缩:压缩后的数据经解压缩还原后与原始数据不完全相同,压缩倍数较大,解压缩后的数据质量会降低

23 压缩和解压缩的速度 2.1.5 数据压缩算法综合评价指标 压缩和解压缩速度是压缩系统的两项重要指标
数据压缩算法综合评价指标 压缩和解压缩的速度 压缩和解压缩速度是压缩系统的两项重要指标 对称压缩:压缩和解压缩需要实时进行,如电视会议的图像传输,压缩和解压缩速度相同 非对称压缩:解压缩实时,压缩非实时,如CD-ROM的制作与播放,压缩比解压缩速度慢 数据的计算量:压缩和解压缩都需要大量的计算,如使用MPEG-1计算352×240的图像,需126720次乘法运算和638880次加法运算。通常解压缩比压缩的计算量小,如MPEG的压缩编码计算量约为解码的4倍。

24 2.2 数据压缩与解压缩常用算法 2.2.1 数据压缩方法的分类 2.2.2 哈夫曼编码 2.2.3 预测编码 2.2.4 变换编码

25 数据压缩方法也称编码方法,有多种分类方法 按是否产生失真分 2.2.1 数据压缩方法的分类
数据压缩方法的分类 数据压缩方法也称编码方法,有多种分类方法 按是否产生失真分 无失真编码:也称可逆编码,无损压缩,此类方法解压缩后的还原数据与原始数据完全一致 有失真编码:也称不可逆编码,有损压缩,此类方法解压缩后的还原数据与原始数据不完全一致

26 按原理分 2.2.1 数据压缩方法的分类 预测编码 变换编码 子带编码:分频带编码 针对空间冗余和时间冗余
数据压缩方法的分类 按原理分 预测编码 针对空间冗余和时间冗余 利用已被编码的点的值预测邻近的点的值 变换编码 将图像或时域信号变换到频域上,再进行压缩 子带编码:分频带编码 将数据变换到频域后,按频率分带,分别量化 语言和图像

27 按原理分 2.2.1 数据压缩方法的分类 信息熵编码 统计编码 根据信息熵原理,对概率大的符号用短码字表示,反之用长码字表示
数据压缩方法的分类 按原理分 信息熵编码 根据信息熵原理,对概率大的符号用短码字表示,反之用长码字表示 典型的有哈夫曼编码、行程编码、算术编码 统计编码 根据一幅图像像素值的统计情况进行编码压缩,也可先将图像按前述方法压缩,对所得的值加以统计,再做压缩。统计编码既可单独使用,又可用在某个算法之后做进一步的压缩 最常用的统计编码方法是哈夫曼编码方法

28 数据压缩方法总结 2.2.1 数据压缩方法的分类 特点 描述 无损 无失真地准确地恢复原始数据 有损 有失真 帧内 独立地完成帧的编码 帧间
数据压缩方法的分类 数据压缩方法总结 特点 描述 无损 无失真地准确地恢复原始数据 有损 有失真 帧内 独立地完成帧的编码 帧间 参照前、后帧对帧进行编码,并考虑帧之间的时间冗余 对称 编码及译码的访问几乎相等 不对称 编码时间比译码时间长很多 实时 编-译码延迟不应该超过50ms

29 数据压缩方法的分类 数据压缩方法总结

30 哈夫曼编码 最佳编码定理 哈夫曼1952年提出 内容:在变字长编码中,对于出现概率大的信息符号编以短字长的码,对于概率小的符号编以长字长的码。如果码字长度严格按所对应符号出现概率大小逆序排列,则平均码字长度一定小于其他以任何符号顺序排列方式得到的平均码字长度

31 编码方法 2.2.2 哈夫曼编码 根据以上定理而得到的一种编码方法 步骤
哈夫曼编码 编码方法 根据以上定理而得到的一种编码方法 步骤 1.将符号按出现概率由大到小排列,给最后两个符号赋予一个二进制码,概率大的赋1,小的赋0(反之亦可) 2.把最后两个符号的概率合成一个概率,重复上一步 3.重复步骤2,直到最后只剩下两个概率为止 4.将每个符号所对应的分支的0,1反序排出即可

32 2.2.2 哈夫曼编码 哈夫曼编码过程演示 可以看出,概率大的符号其编码短,概率小的符号其 编码长,符号使用其编码来表示,达到数据压缩目的
哈夫曼编码 哈夫曼编码过程演示 编码 01 00 111 110 101 1001 1000 A1 A2 A3 A4 A5 A6 A7 0.23 0.21 0.18 0.15 0.13 0.07 0.03 1 0.44 1 1 1 0.33 1 0.56 1 0.23 1 0.10 可以看出,概率大的符号其编码短,概率小的符号其 编码长,符号使用其编码来表示,达到数据压缩目的

33 哈夫曼编码 哈夫曼编码过程演示

34 2.2.2 哈夫曼编码 哈夫曼编码结果分析 编码 01 00 111 110 101 1001 1000 码长 2 3 4 码字的平均长度
哈夫曼编码 哈夫曼编码结果分析 编码 01 00 111 110 101 1001 1000 码长 2 3 4 码字的平均长度 _ 7 N=∑niP(ai)=2.72bit i=1 信息符号的熵值 7 H(a)=∑P(ai)log2P(ai) =2.61bit 编码效率:  = 2.61/2.72 ≈ 96% 可见,哈夫曼编码结果,其平均长度接近于信息符号的熵值,但是仍有冗余

35 2.2.2 哈夫曼编码 哈夫曼编码最佳情况示例 信源有四个符号: X a1 a2 a3 a4 1/2 1/4 1/8 1/8 信息熵:
哈夫曼编码 哈夫曼编码最佳情况示例 信源有四个符号: X a a a a4 1/ / / /8 信息熵: H(x)= -1/2  log2(1/2)-1/4  log2 (1/4)- 1/8  log2 (1/8) 2= 1.75 bit/字符

36 2.2.2 哈夫曼编码 哈夫曼编码最佳情况示例 a1 a2 a3 a4 符号 概率 编码 10 110 111 1/2 1/4 1/8 1
哈夫曼编码 哈夫曼编码最佳情况示例 符号 概率 编码 10 110 111 a1 a2 a3 a4 1/2 1/4 1/8 1 1 1 1/2 1 1/4 采用哈夫曼编码(二进制编码) a1 a2 a a4 _ 平均码长:N= (1/2)  1+(1/4)  2+(1/8)  6= 1.75 bit/字符 编码效率:=1.75/1.75=100%

37 2.2.2 哈夫曼编码 哈夫曼编码最佳情况示例 4个符号 采用PCM编码: R= log24=2 bit a1 a2 a3 a4
哈夫曼编码 哈夫曼编码最佳情况示例 4个符号 采用PCM编码: R= log24=2 bit a a a a4 _ N=2 Pi = _ 编码效率:=H(x)/N=1.75/2=87.5%

38 2.2.2 哈夫曼编码 哈夫曼编码的特点 其实就是数据结构中的二叉树形式 无歧义性,能正确地恢复原信号 构造出来的码不唯一
哈夫曼编码 哈夫曼编码的特点 其实就是数据结构中的二叉树形式 无歧义性,能正确地恢复原信号 构造出来的码不唯一 有两种赋值方式:概率大的赋1,小的赋0,反之亦可 两符号概率相等时,其排列顺序随机,造成编码不唯一

39 2.2.2 哈夫曼编码 哈夫曼编码的特点 编码出来的字长不统一,硬件实现困难 对不同的信号源,编码效率不同,等概率信源,效率最低
哈夫曼编码 哈夫曼编码的特点 编码出来的字长不统一,硬件实现困难 对不同的信号源,编码效率不同,等概率信源,效率最低 编码后形成一个哈夫曼编码表,若正确解码必须有此码表,于是在传送过程中也要传送此码表

40 原理 2.2.3 预测编码 利用以往的样本值对新样本值进行预测 将新样本值的实际值与其预测值相减,得到误差值
预测编码 原理 利用以往的样本值对新样本值进行预测 将新样本值的实际值与其预测值相减,得到误差值 对该误差值进行编码,传送此编码即可 理论上数据源可以准确地用一个数学模型表示,使其输出数据总是与模型的输出一致,因此可以准确地预测数据,但是实际上预测器不可能找到如此完美的数学模型

41 典型方法 2.2.3 预测编码 DPCM:差分脉冲调制预测,Differential Pulse Code Modulation
预测编码 典型方法 DPCM:差分脉冲调制预测,Differential Pulse Code Modulation ADPCM:自适应差分脉冲调制预测,Adaptive Differential Pulse Code Modulation

42 预测编码 差分脉冲调制预测 差分脉冲调制(Differential Pulse Code Modulation,简称DPCM)是降低每个像素所需平均比特数最实用的方法。对于绝大多数图像来说,在局部空间和时间上是高度相关的,因而可以在已得到像素的基础上通过对当前像素的预测来减少图像的数据量

43 2.2.3 预测编码 差分脉冲调制预测——原理图 dn dn’ - 量化器 编码器 Xn Xn Xn’ 预测器 + 发送端 dn’ 译码器
预测编码 差分脉冲调制预测——原理图 dn dn’ 量化器 编码器 Xn ^ Xn Xn’ 预测器 发送端 dn’ 译码器 Xn’ ^ Xn 接收端 预测器

44 预测编码 差分脉冲调制预测 发送端预测器带有存储器,把tn时刻以前的采样值x1, x2, x3, xn-1存储起来并据此对xn进行预测,得到预测值 dn为xn与 的差值,dn’为dn经量化器量化的值 xn’是接收端的输出信号 误差qn为 qn= xn- xn’= xn-( +dn’)=(xn- )- dn’= dn - dn’ 实际上就是发送端的量化器对误差量化的误差 对 dn’的量化越粗糙,压缩比越高,失真越大 ^ Xn ^ Xn ^ Xn ^ Xn

45 差分脉冲调制预测——对于图像预测编码 2.2.3 预测编码
预测编码 差分脉冲调制预测——对于图像预测编码 Xn表示被预测的像素, x1, x2, x3, xn-1则是根据不同的预测方案被选出来的已知像素点 一维预测:同一行 二维预测:不同行 三维预测:不同帧 X1 xn X5 X4 X3 X2 X1 Xn

46 差分脉冲调制预测——对于图像预测编码 2.2.3 预测编码
预测编码 差分脉冲调制预测——对于图像预测编码 一维预测利用像素之间在水平方向上的相关性。在水平方向上亮度变化缓慢地图像效果好。但是有亮度 突变就不行。 图中黑白条: =x1=0(黑色) 可采用二维预测: x4-x =x1+———— = — ^ Xn x1 xn X5 X4 X3 X2 X1 Xn + - ^ Xn

47 差分脉冲调制预测 2.2.3 预测编码 适用于输入数据为平稳的随机过程
预测编码 差分脉冲调制预测 适用于输入数据为平稳的随机过程 预测器设计是预测编码系统的核心,预测器的复杂程度与线性预测中使用以前的样本数有关,样本数越多,预测器越复杂 对预测误差的量化是造成图像质量下降的主要原因,表现为: 斜率过载:图像轮廓变模糊 颗粒噪声:图像在平坦区出现颗粒状的细斑 边缘忙乱:在变化不快的边缘出现闪烁不定现象 伪轮廓:在图像亮度值缓慢变化区域出现伪轮廓

48 预测编码 差分脉冲调制预测——应用示例 例如,取一序列为10,12,14,16,18,20。(例如亮度变化缓慢的图像的亮度值)由于其中所有数字都不相同,但是是一个等差的数列,所以行程编码和哈夫曼对其不产生压缩效果。 先用DPCM方法,其预测器的预测参数为 =Xn-1,则其误差值得到一个新的序列10,2,2,2,2,2。然后再使用行程编码方法对这个新序列进行压缩,压缩结果为10(5,2)。 ^ Xn

49 自适应差分脉冲调制预测 2.2.3 预测编码 输入数据不是平稳的随机过程 自适应预测
预测编码 自适应差分脉冲调制预测 输入数据不是平稳的随机过程 自适应预测 定期重新调整预测器的预测参数,使预测器随输入数据的变化而变化 自适应改变量化器的量化阶数,用小量化阶量化小差值,大量化阶量化大差值 分为线性自适应预测与非线性自适应预测两种

50 原理 2.2.4 变换编码 为达到目的,可以通过不同的路径——殊途同归
变换编码 原理 为达到目的,可以通过不同的路径——殊途同归 例如:数学计算机中,经常利用某些数学函数略加转换可以找出一条计算的捷径。 乘法: X100000= 运算时,数据很大,可以变成对数进行加法 X = 取对数 lg106 算法变换 取对数 lg105 取指数 1011 6 5

51 基本概念 2.2.4 变换编码 先对信号进行某种函数变换,从一种域(空间)变换到另一种域(空间),再对变换后的信号进行编码处理
变换编码 基本概念 先对信号进行某种函数变换,从一种域(空间)变换到另一种域(空间),再对变换后的信号进行编码处理 以声音图像为例,由于声音图像大部分信号都是低频信号,在频域中信号较集中,因此将时域信号变换到频域,再对其进行采样、编码

52 变换编码 变换去除相关性示例 设有两个相邻的数据样本x1和x2,每个样本 采用3比特编码,则各有8个幅度等级,两个样本的联合事件共有64种可能用右图二维平面坐标表示 考虑到相邻样值的相关性,x1和x2同时出现相近幅度的可能性最大。 因此,合成可能性往往落在阴影区内 X2 X1’ X2’ X1

53 变换编码 变换去除相关性示例 如果对数据进行正交变换,从几何上相当于坐标系旋转 45o,变成x1’、x2’坐标系,则在新坐标系下,任凭x1’在较大的范围变化,而x2’始终只在相当小的范围内变化,因此通过这样的变化就能得到一组去除大部分,甚至是全部统计相关性的另一种输出样本

54 变换编码过程 2.2.4 变换编码 输入 A A’ 变换 量化 编码器 G U U为变换矩阵,A,A’:变换系数 发送端 输出 译码器
变换编码 变换编码过程 输入 A A’ 变换 量化 编码器 G U U为变换矩阵,A,A’:变换系数 发送端 输出 译码器 逆变换 G’ 接收端 U’ U’:U的逆变换矩阵

55 离散余弦变换(DCT,Discrete Cosine Transform)
变换编码 KL变换 最佳变换编码方法 变换矩阵不是恒定的,需要临时计算 离散余弦变换(DCT,Discrete Cosine Transform) 准最佳变换,利用三角函数进行的一种变换 DCT的基向量由余弦函数构成 一维DCT变换和二维DCT变换,变换后输出DCT变换系数,将幅度变成频率 广泛应用于图像与视频压缩中,如JPG,MPEG

56 行程编码又称为游程编码、运行长度编码 资料:行程编码 相同值的连续串用该值和串长代替,有多种表示方法
如:MDDDDDDDDDDG用M!10DG或M(10,D)G表示 再如: 用0453表示,第1位0表示该串首码是0,第2位4表示有4个0,第3位5表示5个1,第4位3表示3个0。因为二进制非0即1 行程编码演示

57 资料:LZ77压缩编码 来源 1977年由两个以色列人Lempel,Ziv提出,1984年由Welch改进,成为LZW算法 LZ77技术特点 先进的无损数据压缩技术,压缩和解压缩速度快 稳定,有效,快速 应用 应用在几乎日常使用的所有通用压缩工具中,ARJ,PKZip,WinZip,RAR,ACE以及GIF图像文件等 某些硬件如网络设备中内置的压缩算法

58 资料:LZ77压缩编码 基本原理 将已经编码过的信息作为字典,如果要编码的字符串曾经出现过,就输出该字符串的出现位置及长度,否则输出新的字符串。 解压缩时,自动建立与压缩时一样的串表 简单概括:就是字典压缩,串表即字典

59 资料:LZ77压缩编码 基本原理图示 输入:吃葡萄不吐葡萄皮,不吃葡萄倒吐葡萄皮

60 未压缩:BAABABBBAABBBBAA
资料:LZ77压缩编码 压缩过程示例 未压缩:BAABABBBAABBBBAA BAABABBBAABBBBAA B 1 解析字符串 AABABBBAABBBBAA B,A A B A 1 2 解析字符串

61 资料:LZ77压缩编码 压缩过程示例 ABABBBAABBBBAA B,A,2B AB 解析字符串 ABBBAABBBBAA
解析字符串 ABBBAABBBBAA B,A,2B,3B ABB B A AB ABB 解析字符串 BAABBBBAA B,A,2B,3B,1A BA B A AB ABB BA 解析字符串

62 压缩后: B,A,2B,3B,1A,4B,5A 资料:LZ77压缩编码 压缩过程示例 ABBBBAA B,A,2B,3B,1A,4B
B A AB ABB BA ABBB 解析字符串 BAA B,A,2B,3B,1A,4B,5A B A AB ABB BA ABBB BAA 解析字符串 压缩后: B,A,2B,3B,1A,4B,5A

63 已压缩: B,A,2B,3B,1A,4B,5A 资料:LZ77压缩编码 解压缩过程示例 B,A,2B,3B,1A,4B,5A B 解析字符串
1 2 解析字符串

64 资料:LZ77压缩编码 解压缩过程示例 2B,3B,1A,4B,5A BAAB 2B 解析字符串 3B,1A,4B,5A BAABABB
解析字符串 3B,1A,4B,5A BAABABB 3B B A AB ABB 解析字符串 1A,4B,5A BAABABBBA 1A B A AB ABB BA 解析字符串

65 解压缩后:BAABABBBAABBBBAA
资料:LZ77压缩编码 解压缩过程示例 4B,5A BAABABBBAABBB 4B B A AB ABB BA ABBB 解析字符串 5A BAABABBBAABBBBAA B A AB ABB BA ABBB BAA 解析字符串 解压缩后:BAABABBBAABBBBAA

66 2.3.1 音频压缩标准 2.3.2 静止图像压缩编码标准JPEG 2.3.3 数字声像压缩标准MPEG-1
2.3 多媒体数据压缩常用压缩标准 2.3.1 音频压缩标准 2.3.2 静止图像压缩编码标准JPEG 2.3.3 数字声像压缩标准MPEG-1 2.3.4 通用视频压缩标准MPEG-2 2.3.5 低比特率音视频压缩标准MPEG-4

67 音频压缩标准 音频压缩方法 熵编码 波形编码:在信号采样和量化过程中考虑人的特性,适应人的应用要求,PCM、DPCM、ADPCM等 参数编码:将音频信号以某种模型表示,压缩倍数很高,计算量大,保真度不高,适合对语音信号编码 混合编码:吸取波形和参数编码的优点,综合编码

68 音频压缩方法 2.3.1 音频压缩标准 哈夫曼编码 无损压缩 算术编码 游程编码 波形编码 有损压缩 参数编码 混合编码 PCM (熵编码)
音频压缩标准 音频压缩方法 哈夫曼编码 无损压缩 算术编码 用于公共网 ISDN配音 PCM (熵编码) 游程编码 µ(A) 波形编码 DPCM ADPCM SB-ADPCM 有损压缩 用于保密电话 (熵压缩) 参数编码 LPC 用于移动通信 CELPC VSELP 用于语音邮件 混合编码 用于ISDN PRE-LTP MPEG 用于CD AC-3 用于音响

69 音频压缩标准 评价 计算MOS(Mean Objection Score)值,请40-60位有代表性人听同一段语音,给出评分。分值范围在1-5分,4分以上为可收费得分

70 电话质量的音频压缩技术标准 2.3.1 音频压缩标准 G.711标准:1972年,非线性量化PCM 编码,64kbps
音频压缩标准 电话质量的音频压缩技术标准 G.711标准:1972年,非线性量化PCM 编码,64kbps G.721标准:1984年,ADPCM,32kbps G.728标准:1992年,基于短时延码本激励线性预测编码LD-CELP ,16kbps G.729标准:基于共轭结构代数码本激励线性预测编码CS-ACELP ,8kbps

71 音频压缩标准 电话质量的音频压缩技术标准 GSM标准:1992年,德国,长时延线性预测规则码本激励RPE-LTP 编码,13kbps CTIA标准:1989年,美国,矢量和激励线性预测技术VSELP ,8kbps 美国国家安全局1982年采用LPC算法,2.4kbps 美国国家安全局1989年采用CELPC算法,4.8kbps

72 广播质量的音频压缩技术标准 高保真度立体声音频压缩技术标准 2.3.1 音频压缩标准
音频压缩标准 广播质量的音频压缩技术标准 G.722标准:1988年,64kbps,从采样频率为16kHZ,量化为14bit的224kbps中压缩而来,可以在窄带ISDN中传送调幅广播质量的音频信号. 高保真度立体声音频压缩技术标准 MPEG标准:MP3 AC-3标准 5.1声道(6声道):左、中、右、左环绕、右环绕、低频增强(频率在20~120HZ,0.1声道) 采样频率48kHZ,量化16~22bit

73 ISO联合图像专家组为单帧彩色图像的压缩制订,可以由用户自行设定压缩比例
静止图像压缩编码标准JPEG ISO联合图像专家组为单帧彩色图像的压缩制订,可以由用户自行设定压缩比例

74 编码方法 2.3.2 静止图像压缩编码标准JPEG 与彩色空间无关,因此RGB-YUV,YUV-RGB的变换不包含在JPEG算法中
采用混合编码方法

75 两种基本算法 2.3.2 静止图像压缩编码标准JPEG 采用DPCM的无失真压缩算法 采用DCT加行程编码的有失真压缩算法
基本系统:是一种基于DCT的简化编码方法,该系统保证必须的功能,可满足大多数应用的要求。所有JPEG编解码器都必须支持基本系统。输入图像精度为8bits/像素/色,支持顺序模式,采用Huffman编码 扩展系统:是为了满足更为广阔的应用要求而设置的。增强了数据压缩能力,输入图像精度可达12bits/像素/色,支持渐进模式,可采用哈夫曼编码和算术编码

76 四种编码模式 2.3.2 静止图像压缩编码标准JPEG
DCT顺序模式:其基本算法是将图像分成8×8的块,然后进行DCT变换、量化和熵编码(哈夫曼编码)。这种模式每个图像分量的编码一次扫描完成的 DCT渐进模式:所采用的算法与DCT顺序模式相类似,不同的是需要对图像进行多次扫描, 先传送部分DCT系数信息(如低频带的系数或所有系数的近似值),使接收端尽快获得一个“初略”的图像,然后再将剩余频带的系数渐次传送,最终形成清晰的图像

77 静止图像压缩编码标准JPEG 四种编码模式 DCT顺序和DCT渐进模式示意图 顺序模式 渐进模式

78 四种编码模式 2.3.2 静止图像压缩编码标准JPEG
无失真编码模式:采用一维或二维的空间域DPCM和熵编码。由于输入图像已经是数字化的,经过空间域的DPCM之后,预测误差值也是一个离散量,因此可以不再量化而实现无失真编码 分层编码模式 这是对一幅原始图像的空间分辨率,分成多个分辨率进行“锥形”的编码方法,水平(垂直)方向分辨率的下降以2的倍数因子改变,先对分辨率最低的一层图像进行编码,然后将经过内插的该层图像作为下一层图像的预测值,再对预测误差进行编码,以次类推,直到底层

79 JPEG标准的无失真预测编码 2.3.2 静止图像压缩编码标准JPEG 压缩过程原理 无失真编码器 原图象数据 预测器 熵编码器
压缩图象数据 码表说明

80 JPEG标准的无失真预测编码 2.3.2 静止图像压缩编码标准JPEG 无失真编码器采用三邻域采样值法,由a,b,c预测x,得x’
压缩比低:2:1 c b a x 三邻域预测公式 序号 X’值 非预测 4 a+b+c 1 a 5 A+((b-c)/2) 2 b 6 B+((a-c)/2) 3 c 7 (a+b)/2

81 JPEG标准的基于DCT的有失真压缩编码
编码过程 编码器 8*8块 DCT 正变换 量化器 熵编码器 压缩后的图像数据 源图像 数据 码表说明 基于DCT编码的简化框图

82 JPEG标准的基于DCT的有失真压缩编码
编码过程:基于DCT的编码过程为:先进行DCT正变换,然后再对DCT系数进行量化,并对量化后的直流(DC)系数和交流(AC)系数分别进行差分编码和行程编码,最后再进行熵编码

83 JPEG标准的基于DCT的有失真压缩编码
解码过程 解码器 8*8块 DCT 逆变换 熵解码器 量化器 压缩的图像数据 恢复的图像数据 码表说明 码表说明 基于DCT解码器的简明框图

84 JPEG标准的基于DCT的有失真压缩编码
说明:以上给出的是单个彩色分量的编码、解码过程,对于彩色图像,可将多个分量分别处理 数据单元 无损模式:一个像素为一个数据单元 有损模式:采用8×8像素块作为一个数据单元 采样点 * * * * * * 采样行 Yi CN Xi C2 N≤ 255 C1

85 JPEG标准的基于DCT的有失真压缩编码
数据单元的处理 逐行排序:每个分量数据单元的处理从左向右、从上向下,一个分量接一个分量,对于图像的解码需要全部完成才能正确显示图像。 交叉排序:不同分量 的交叉数据单元组合 成最小编码单元MCU, 编码时可以按MCU进 行,解码时可以一个 MCU一个MCU地显 示图像,甚至允许对 图像部分解码。 * * * * * * *

86 JPEG标准的基于DCT的有失真压缩编码
编码步骤——切割分块 JPEG采用8X8像素的二维DCT变换,在编码器输入端把原始图像顺序分割成8X8的子块,分割可采用逐行排序或交叉排序方法。如果原始图像的采样精度为P位,是无符号整数,则将[0,2P-1]转换为[-2P-1,2P-1-1]的有符号整数,作为DCT的输入 解码时,经DCT逆变换后得到8X8的图像数据块,在将[-2P-1,2P-1-1]变回[0,2P-1],获得重构的图像

87 JPEG标准的基于DCT的有失真压缩编码
对原始图像的所有数据块进行DCT变换,每个数据块经过DCT变换后,输出64个DCT变换系数,形成一个8X8矩阵,其中包含一个代表直流分量的DC系数(矩阵的左上角,代表此块的彩色分量的平均值)和63个代表交流分量的AC系数(代表该块的彩色分量的起伏变化的剧烈程度)

88 JPEG标准的基于DCT的有失真压缩编码
二维8X8DCT正变换(FDCT)和逆变换(IDCT)公式

89 JPEG标准的基于DCT的有失真压缩编码
将8×8像素块映 射到频域上,即 选用64个因子代 表各个不同的水 平和垂直亮度, 将其描述为DCT 基本函数的组合 垂直频率的增加 水平频率的增加

90 JPEG标准的基于DCT的有失真压缩编码
垂直 对角线 水平

91 JPEG标准的基于DCT的有失真压缩编码
DCT逆变换通过这64个DCT变换系数重建这8X8图像,由于计算过程中的精度损失和量化,不可能完全恢复原始图像——有损压缩

92 JPEG标准的基于DCT的有失真压缩编码
编码步骤—— 量化 为达到压缩数据的目的,对DCT变换系数F(u,v)进行量化处理。量化是造成图像质量下降的最主要原因。利用人的视觉特性,经过大量实验,获得了量化表Q(u,v)。量化公式为 FQ(u,v)=Integer ( Round(F(u,v)/Q(u,v)) 解压缩时反量化公式为: FQ’(u,v)=FQ (u,v)*Q(u,v)

93 JPEG标准的基于DCT的有失真压缩编码
编码步骤—— 量化 量化特性 0.5 1 2 3 -0.5 -1 -2 F(U,V)/Q(U,V) FQ(U,V)

94 JPEG标准的基于DCT的有失真压缩编码
编码步骤—— 量化 利用人的视觉特性,经过大量实验,获得了量化表量化表。根据不同的量化表,可以做出不同压缩比的JPEG文件。用户也可以自己定义量化表 亮度量化表 色度量化表 16 11 10 24 40 51 61 12 14 19 26 58 60 55 13 57 69 56 17 22 29 87 80 62 18 37 68 109 103 77 35 64 81 104 113 92 49 78 121 120 101 72 95 98 112 100 99 17 18 24 47 99 21 26 66 56

95 JPEG标准的基于DCT的有失真压缩编码
DC系数:DCT变换系数经过量化后,直流分量DC数值比大,而且相邻的两个8X8块的DC系数有很强的相关性,变化不大, 因此采用DPCM对相邻两块的DC的差值Delta进行编码Delta=DCi-DCi-1

96 JPEG标准的基于DCT的有失真压缩编码
AC系数:DCT变换系数经过量化之后,有大量AC会变成0,可采 用游程编码进一步 进行数据压缩。为 增加编码效率,采 用“Z”字形的次 序来进行游程编码, 可以增加连续0的 个数。

97 JPEG标准的基于DCT的有失真压缩编码
编码步骤——哈夫曼编码 DC和AC系数进行DPCM和行程编码后,对其编码后的数据再次进行哈夫曼编码,以提高压缩效率 编码步骤——组成位数据流 这是JPEG编码的最后一个步骤,即把各种标记代码和图像编码后的图像数据组成一帧一帧的数据,以便于传输、存储和译码器译码

98 示例 静止图像压缩编码标准JPEG 有失真压缩过程示例 源图像样本 量化后的系数 DCT正变换系数 量化表

99 静止图像压缩编码标准JPEG 有失真压缩过程示例 逆量化后的系数 量化后的系数 量化表 重构的图像样本

100 2.3.3 数字声像压缩标准MPEG-1 数字声像的压缩率与质量与很多因素有关 帧速度 帧率 (fps) 文件容量 (KB) 效果 实例 6
217 画面出现跳动的不连续感 15 637 画面基本连续,是实际应用中较常使用的参数 25 1134 理想的帧率,但数据量太大 注:连续3页的视频摘录自《数字媒体-技术·应用·设计》

101 2.3.3 数字声像压缩标准MPEG-1 数字声像的压缩率与质量与很多因素有关 不但原始数据源有关,还与颜色深度有关 图像深度(bit)
播放效果 实例 8 色彩基本连续 24 色彩连续

102 2.3.3 数字声像压缩标准MPEG-1 数字声像的压缩率与质量与很多因素有关 与压缩算法和压缩倍数等有关 压缩质量 90% 50% 20%
文件容量 4800KB 986KB 701KB 播放效果 有一定压缩痕迹 压缩痕迹明显 画面清晰度 严重受损 实例

103 MPEG(Motion Picture Experts Group)
针对活动视频的压缩标准系列 MPEG-1:适用于传输速率为1.5Mbps的数字电视标准,91年提出草案,93年8月公布 MPEG-2:适用于传输速率为10Mbps 的数字电视标准,93年提出草案,94年11月公布 MPEG-4:1999年12月公布的多媒体应用标准

104 MPEG(Motion Picture Experts Group)
MPEG-21:正式名称是Multimedia Framework (多媒体框架),是为大范围的网络上实现透明的传输和对多媒体资源的充分利用而制定的标准,确定是否需要将不同的协议、标准、技术等有机融合在一起

105 MPEG-1简介 2.3.3 数字声像压缩标准MPEG-1
标准名称:用于数字存储媒体运动图像及其伴音速率为1.5MBps的压缩编码,简称MPEG-1 1991年制订,最初为CD-ROM制订 标准的组成:MPEG专家组下设3个委员:MPEG系统委员会、MPEG视频委员会和MPEG音频委员会。这三个委员会分别制定了三个标准,即MPEG系统标准、MPEG视频标准、MPEG 音频标准

106 MPEG-1简介 2.3.3 数字声像压缩标准MPEG-1 MPEG系统标准:该标准定义了多道压缩音频、视频码流的的同步和合成
标准支持特性:随机存取、快速搜索、逆向播放、编辑功能

107 数字声像压缩标准MPEG-1 MPEG-1标准的参数 352*240 每秒30帧播放 352*288 每秒25帧播放

108 运动图像序列(Video Sequence)
数字声像压缩标准MPEG-1 MPEG-1标准的视频数据码流 MPEG-1规定了视频压缩数据码流的语法结构,这个语法结构将视频压缩数据码流分为6层。 运动图像序列(Video Sequence) 图像组 图像组(Group Of Pictures,GOP):由一系列图像帧组成,这些图像可以从运动序列中随机抽取。

109 MPEG-1标准的视频数据码流 图像组 图像 Y : U : V 8 : 2 : 2 2.3.3 数字声像压缩标准MPEG-1
图像(Picture):一个图像(静止图像,一帧)由三个部分组成 一个亮度信号Y 两个色差信号UV Y : U : V 8 : 2 : 2

110 MPEG-1标准的视频数据码流 图像 图像条 2.3.3 数字声像压缩标准MPEG-1
图像条(Slice):图像帧内的水平条,由附加数据及一个或多个宏块组成。每个图像条16bit高,宽与图像帧宽度相同

111 MPEG-1标准的视频数据码流 图像的切片 宏块 2.3.3 数字声像压缩标准MPEG-1
宏块:MPEG的基本编码单元,即进行运动补偿的单元。由16X16像素的亮度(Y)信息和两个8X8像素的色度(U,V)信息组成。宏块由附加数据及四个亮度(Y)信号块和两个色差信号(U,V各一块)块组成。

112 一个宏块由附加数据及四个亮度(Y)信号块和两个色差信号(U,V各一块)块组成。
数字声像压缩标准MPEG-1 MPEG-1标准的视频数据码流 宏块(1616) 块(88) 每块:8*8像素,可以是亮度Y或色度U,V 一个宏块由附加数据及四个亮度(Y)信号块和两个色差信号(U,V各一块)块组成。 Y : U : V 8 : 2 : 2

113 MPEG视频码流分层结构图 2.3.3 数字声像压缩标准MPEG-1 图像序列头 图像组 图像组 …… 图像组 图像组 序列层 图像组头
图像组层 (I、P、B) (I、P、B) …… 图像层 图像头 图像条 图像条 宏块 宏块 图像条头 …… 图像条层 MB MB MPEG视频码流分层结构图 1 2 5 6 宏块层 8*8 8*8 8*8 8*8 3 4 Cr Cb 8*8 8*8 Y 块层 8*8

114 MPEG-1算法基本思想 2.3.3 数字声像压缩标准MPEG-1

115 MPEG-1算法基本思想 2.3.3 数字声像压缩标准MPEG-1
MPEG-1标准推荐的算法是以两个基本技术为基础的,一个是基于16×16子块的运动补偿技术,用以减少帧序列的时域冗余度;另一个是基于DCT的压缩技术,用以减少空域冗余度,在MPEG-1中,不仅帧内使用DCT,而且对帧间预测也使用DCT,以进一步减少数据量

116 MPEG-1算法基本思想 2.3.3 数字声像压缩标准MPEG-1
为了实现随机存取,最好要用帧内编码。为了把编码电视图像的位速率限制在1.2Mbps,既要有较高的压缩率,又要获得高质量的图像,就要求在帧内和帧间编码之间进行折中。由于在时间上进行正负方向的帧间预测编码可以有更高的图像压缩比,因此,MPEG将图像帧分成三类 I-图像帧(Intra-coded picture):内帧 P-图像帧(Predictive-coded picture):预测帧 B-图像帧(Bidirectionally predictive-coded picture):双向帧

117 MPEG-1图像帧 2.3.3 数字声像压缩标准MPEG-1 I-图像帧:帧内编码图像帧,内帧
静态图像,只利用自身信息进行编码,采用JPEG方式 可作为压缩数据流中的随机存取点——快进、快退等

118 MPEG-1图像帧 2.3.3 数字声像压缩标准MPEG-1 P-图像帧:预测编码图像帧,预测帧 B-图像帧:双向预测编码图像帧,双向帧
利用最近的前一个I-帧或P-帧作为参考 采用带运动补偿技术的帧间预测进行编码—前向预测 通常作为后续的P-帧或B-帧的预测参考帧 B-图像帧:双向预测编码图像帧,双向帧 既利用过去的I-帧或P-帧(前向),也利用后来的I-帧或P-帧(后向)作为参考 进行带运动补偿技术的双向预测编码 从不作为预测的参考帧

119 MPEG-1图像帧 前向预测 1 I 2 B 3 B 4 P 5 B 6 B 7 P 8 I 双向预测
三种图像帧的典型排列方式 前向预测 1 I 2 B 3 B 4 P 5 B 6 B 7 P 8 I 双向预测

120 MPEG-1图像帧 1秒 2.3.3 数字声像压缩标准MPEG-1 三种图像帧的典型排列方式 参照帧间 有两个B-帧
每15帧(0.5秒)有一个I-帧 I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B

121 MPEG-1图像帧 2.3.3 数字声像压缩标准MPEG-1
图像组一般由一个I-帧,几个P-帧和若干个B-帧组成。MPEG-1的算法允许编码器选择I-帧的频率和位置。 一般每0.5秒以内必须传送一次I-帧 PAL制式:图象组12帧 NTSC制式:图象组15帧 从I-帧(或P-帧)得到P-帧, P-帧压缩比60:1 从I-帧或P-帧得到B-帧, B-帧压缩可达200:1 MPEG-1算法不对称,压缩比解压缩复杂,慢 编码器需要选择位于I-帧和P-帧间B-帧的数目

122 帧内编码技术 2.3.3 数字声像压缩标准MPEG-1 针对I-图像帧,采用DCT方法,与JPEG压缩方式相似,只是量化器稍有差别
图像压缩过程:以NTSC制式为例 彩色空间转换:将RGB信号转换为亮度Y和色差C信号。每一像素的亮度都传送,而色差信号分为U=Y-R,V=Y-B传送,每传送4个亮度信号才传送一个色差信号,称为YUV 4:1:1格式。经过YUV 4:1:1格式采样后,信息量减少了50% 例:RGB格式:各8 bit——24bit/像素 YUV 4:1:1格式:Y 8bit,U,V各2bit——12bit/像素

123 数字声像压缩标准MPEG-1 帧内编码技术 采用与JPEG相似的压缩编码方式 Zig-zag:Z字型排列

124 数字声像压缩标准MPEG-1 帧间编码技术 原理:NTSC每秒30帧,每帧的主体只有少许差异,背景差异更小,即相隔1/30秒之间的两帧画面中,景物主体运动在画面上的位移量或整幅画面切换的概率极小,因此可以通过运动补偿技术进行压缩

125 帧间编码技术 2.3.3 数字声像压缩标准MPEG-1 过程
运动补偿:对数据码流,将一幅画面的某一宏块与参考画面中的邻近范围内的宏块进行数值对比,寻找与该快最接近的、误差最小的块,只需记录该块在两个画面中的位移量(运动向量)以及差值部分 根据运动向量坐标的变化和块的差值,可算出该块是否移动以及形状是否改变,在传送时可以省略背景和主体详情,只传送代表运动向量和块差值的少许数据,再根据这少许数据还原整个画面

126 帧间编码技术 2.3.3 数字声像压缩标准MPEG-1 运动补偿技术主要用于消除P-帧和B-帧在时间上的冗余,提高压缩效率,在宏块一级进行
图像帧 所含宏块类型 宏块简称 宏块采用技术 I-帧 帧内宏块 I块 DCT技术 P-帧 前向预测宏块 F块 参照前一个I或P帧预测 B-帧 后向预测宏块 B块 参照后一个I或P帧预测 平均宏块 A块 参照前后的I或P帧预测

127 帧间编码技术 2.3.3 数字声像压缩标准MPEG-1 基于宏块的运动补偿技术就是在其参照帧中找出符合一定条件的块作为当前块的最佳匹配块
对于F宏块和B宏块,只找一个最佳匹配块 对于A宏块,其前后参照帧各有一个最佳匹配块 运动向量 采用预测器对预测点坐标进行预测,用实际坐标减去预测坐标,得到预测误差,对预测误差进行压缩编码

128 数字声像压缩标准MPEG-1 帧间编码技术 最佳匹配块及运动向量示意图 最佳匹配块 时刻1 运动向量 时刻2

129 数字声像压缩标准MPEG-1 帧间编码技术 最佳匹配块及运动向量示意图 运动向量

130 数字声像压缩标准MPEG-1 帧间编码技术——前向预测 最佳匹配 运动向量 RLE:行程编码

131 数字声像压缩标准MPEG-1 帧间编码技术——双向预测 RLE:行程编码 运动向量

132 三种图像帧比较 2.3.3 数字声像压缩标准MPEG-1 压缩比:I-帧最少, P-帧次之, B-帧最大
画面的数据量 I-帧:19000B P-帧:10000B B-帧: B(平均2875B)

133 编码过程 2.3.3 数字声像压缩标准MPEG-1 由MPEG编码器完成 视频图像输入时,其中场景相同的几幅画面组成图象组
一图像组的第一帧输入到编码器时,对其进行处理 彩色空间转换:RGB-YUV 分成图像条,高16bit 将图像条分成16bit宽,构成16X16宏块 将宏块分成4个8X8的块,进行DCT编码 所有的块完成后,形成I-帧

134 编码过程 2.3.3 数字声像压缩标准MPEG-1 第二帧及以后帧 每13或15帧后或者当场景变更,设立新I-帧。两个I-帧间隔0.5秒
对第二帧完成同样操作 与第一帧比较,若差别很小,存储差值部分 按此方法对其后各帧进行处理,直道找到某一帧与第一帧的差别超过规定值(如第4帧) 将此帧与第一帧的差别存储起来,排在第一帧后输出,P-帧 将第2、3帧与p-帧再次比较,传送差别,B-帧 一次类推,不断选出P和B帧 每13或15帧后或者当场景变更,设立新I-帧。两个I-帧间隔0.5秒

135 解码过程:编码的逆过程 2.3.3 数字声像压缩标准MPEG-1 读出I-帧,解码,彩色空间转换,得到I图像帧,存入帧存储器中
I图像帧与后续的P-帧信息相加,恢复P图像帧,存入帧存储器中 根据I、P图像帧恢复B图像帧,存入帧存储器中 将解压后的I、P、B图像帧存入缓冲器中,按照制式要求以I B B P B B P ……正常顺序输出播放

136 运动图像的显示顺序与传输顺序不相同 1 4 2 3 7 5 6 I P B B P B B 1 2 3 4 5 6 7
数字声像压缩标准MPEG-1 运动图像的显示顺序与传输顺序不相同 I P B B P B B 传输顺序 I B B P B B P 显示顺序

137 1994年制订,兼容MPEG-1标准 MPEG-2标准主要分为四部分 2.3.4 通用视频压缩标准MPEG-2
视频:说明视频数据的编码表示和重建图像所需要的解码处理过程。 音频:说明多个通道音频数据的编码表示。 一致性测试:说明检测编码比特流特性的过程以及测试与上述三部分所要求的一致性。

138 MPEG-2标准 2.3.4 通用视频压缩标准MPEG-2 级 别 最大的分辨率 用途 传输率 Low 352 * 240 * 30
352 * 288 *25 面向VCR,与MPEG-1兼容 4 Mb/s Main 720 * 480 * 30 720 * 576 * 25 面向视频广播信号,DVD 15 Mb/s High 1440 1440*1152*30 HDTV,4:3格式 60 Mb/s High 1920*1080* 30 HDTV,16:9格式 80 Mb/s

139 MPEG-2与MPEG-1对比 2.3.4 通用视频压缩标准MPEG-2 图像格式 图像质量,编码/解码延迟 分层编码:MPEG-1不支持
应用 MPEG-1:VCD MPEG-2:CVD,DVD,HDTV

140 1993年9月开始研究,1999形成草案 基于内容的压缩编码方法 2.3.5 低比特率音视频压缩标准MPEG-4
引入AVO(Audio/Video Object)概念 将图像或音频分解为对象或实体 对AVO进行编码处理,形成对象层码流 AVO非常重要,对其的操作 采用AVO表示听觉、视觉或者视听组合内容 允许用已有的AVO组成新的AVO,并生成AVO场景 允许AVO对路合成与同步 允许接收端的用户在AV场景中对AVO进行交互操作

141 2.3.5 低比特率音视频压缩标准MPEG-4 AVO合成 背景图 一个VO 合成显示

142 2.3.5 低比特率音视频压缩标准MPEG-4 编/解码过程示意

143 AVO分割 2.3.5 低比特率音视频压缩标准MPEG-4 自然视频对象 对象分割 前景对象形状信息 News视频序列 对象分割
Coastguard 视频序列

144 是世界上第一个得到广泛承认并产生巨大影响的数字视频压缩编码标准,是JPEG, MPEG-1, MPEG-2, MPEG-4的基础和核心
资料:视频会议压缩编码标准H.261 是世界上第一个得到广泛承认并产生巨大影响的数字视频压缩编码标准,是JPEG, MPEG-1, MPEG-2, MPEG-4的基础和核心 为N-ISDN上开展双向声像业务(可视电话、会议)而制订 对CIF和QCIF两种图像格式进行处理 压缩编码算法的基础和核心是混合编码技术,即由运动补偿的帧间DPCM、块DCT变换和变字长熵编码组成

145 练习题 1. 图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关,这是 。 (A) 空间冗余 (B) 时间冗余 (C) 信息熵冗余 (D) 视觉冗余 2. 下列哪种说法不正确? (A) 预测编码是一种只能针对空间冗余进行压缩的方法。 (B) 预测编码是根据某一模型进行的。 (C) 预测编码需将预测的误差进行存储或传输。 (D) 预测编码中典型的压缩方法有DPCM、ADPCM。

146 练习题 3.在MPEG中为提高数据压缩比,采用了哪些方法? (A)运动补偿与运动估计。 (B)减少时域冗余与空间冗余。 (C)帧内图像数据与帧间图像数据压缩。 (D)向前预测与向后预测。 4.在JPEG中使用了哪两种熵编码方法? (A)统计编码和算术编码。 (B)PCM编码和DPCM编码。 (C)预测编码和变换编码。 (D)哈夫曼编码和行程编码。


Download ppt "第二章 多媒体数据压缩编码技术."

Similar presentations


Ads by Google