第十二章基于DCT变换的视频压缩编码原理

Slides:

Advertisements

Similar presentations

因数与倍数 2 、 5 的倍数的特征

Advertisements

第四章多媒体数据压缩编码技术多媒体数据压缩编码技术的重要性和分类多媒体数据压缩编码技术的重要性和分类量化统计编码预测编码变换编码多媒体数据压缩编码的国际标准.

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

第三节微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出实例 : 正方形金属薄片受热后面积的改变量.

Chapter 3: SQL.

第六章图象数据压缩编码基本内容图像压缩基础无损压缩有损压缩静止图像压缩编码的技术标准JPEG.

AVS视频编码标准常丽娜 2004/12/06.

《解析几何》乐山师范学院 0 引言 §1 二次曲线与直线的相关位置.

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

第2章压缩编码技术.

淄博信息工程学校 ZIBOIT&ENGINEERING VOCATONAL SHCOOL 02 认识虚拟局域网计算机网络技术专业.

第6章图像压缩.

第十章运动图像压缩标准MPEG 10.1 从MPEG1到MPEG7：MPEG标准简述 10.2 MPEG的编码与实现过程

第10章运动图像压缩标准MPEG 10.1 从MPEG1到MPEG7：MPEG标准简述 10.2 MPEG的编码与实现过程

数一数. 数一数小朋友们，你还能用其他方法来表示飞机吗，为什么？你能用数学棒来表示飞机吗？小朋友们，你还能用其他方法来表示飞机吗，为什么？绿色圃中小学教育网

2-7、函数的微分教学要求教学要点.

在PHP和MYSQL中实现完美的中文显示

H.264/AVC视频编解码技术概念与实现.

面向对象建模技术软件工程系林琳.

强连通分量无向图 1、任意两顶点连通称该图为连通图 2、否则将其中的极大连通子图称为连通分量 A D C B E 有向图

第六章图像编码 CHAPTER 6 IMAGE ENCODING §1 基本概念 §2 简单编码方法 §3 预测编码方法

走进编程程序的顺序结构（二）.

第十章方差分析.

动态规划(Dynamic Programming)

工业机器人技术基础及应用主讲人：顾老师

绿色圃中小学教育网比例比例的意义绿色圃中小学教育网

多媒体技术中南大学信息科学与工程学院黄东军.

排列组合 1. 两个基本原理分类加法计数原理分步乘法计数原理.

图片与视频数字化. 图片与视频数字化图片分类根据图片的构成元素来分位图：由像素组成，计算机按顺序存储每个像素点的颜色信息的保存方式获得的图片。位图放大后会模糊失真，存储空间相对较大。矢量图：由图元组成，通过数学公式计算获得的图片。放大后不会失真，占用空间小。

C语言程序设计主讲教师：陆幼利.

第四章习题.

概率统计主讲教师叶宏山东大学数学院.

Three stability circuits analysis with TINA-TI

线性代数厦门大学线性代数教学组 2019年4月24日6时8分 / 45.

第三节　常见天气系统.

主要内容：无线局域网的定义无线传输介质无线传输的技术 WLAN的架构无线网络搭建与配置无线网络加密配置

用计算器开方.

1.2 有理数第1课时有理数伏家营中学付宝华.

多媒体通信原理第2章数据压缩编码基本理论.

成绩是怎么算出来的？ 16级第一学期半期考试成绩班级姓名语文数学英语政治历史地理物理化学生物总分 1 张三1 115

多媒体技术中南大学信息科学与工程学院黄东军.

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

3．1．2 空间向量的数量积运算 1．了解空间向量夹角的概念及表示方法． 2．掌握空间向量数量积的计算方法及应用．

第八章总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.

1.设A和B是集合，证明：A=B当且仅当A∩B=A∪B

第七、八次实验要求.

线性代数第十一讲分块矩阵.

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

线性代数厦门大学线性代数教学组 2019年5月12日4时19分 / 45.

2019/5/21 实验一离散傅立叶变换的性质及应用实验报告上传到“作业提交”。 11:21:44.

图片与视频数字化. 图片与视频数字化图片分类根据图片的构成元素来分位图：由像素组成，计算机按顺序存储每个像素点的颜色信息的保存方式获得的图片。位图放大后会模糊失真，存储空间相对较大。矢量图：由图元组成，通过数学公式计算获得的图片。放大后不会失真，占用空间小。

基于列存储的RDF数据管理朱敏

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

第8章创建与使用图块将一个或多个单一的实体对象整合为一个对象，这个对象就是图块。图块中的各实体可以具有各自的图层、线性、颜色等特征。在应用时，图块作为一个独立的、完整的对象进行操作，可以根据需要按一定比例和角度将图块插入到需要的位置。 2019/6/30.

第三节数量积向量积混合积一、向量的数量积二、向量的向量积三、向量的混合积四、小结思考题.

信息学院计算机专业０２１学号：０２４１００１３２姓名：魏中州.

数字图像处理北京大学计算机研究所陈晓鸥.

第十七讲密码执行(1).

第十二讲密码执行(上).

FVX1100介绍法视特（上海）图像科技有限公司施俊.

第十章模糊图像变换编码学生：罗龙二零零六年十二月.

三角三角三角函数余弦函数的图象和性质.

使用Fragment 本讲大纲： 1、创建Fragment 2、在Activity中添加Fragment

<编程达人入门课程> 本节内容有符号数与无符号数视频提供：昆山爱达人信息技术有限公司官网地址：联系QQ：

学习目标 1、什么是列类型 2、列类型之数值类型.

Presentation transcript:

第十二章基于DCT变换的视频压缩编码原理

12.1 引言

视频：从本质上说，视频是一组图象帧序列。视频流：由图象帧序列变换而成的比特流。问题：为什么要把视频变成流？

网络传输的需要连续播放的需要信息压缩的需要纠检错的需要流复用以及流控制的需要

如何实现压缩的视频流？视频压缩的核心就是DCT变换什么是DCT变换？

DCT变换，即离散余弦变换是变换编码中应用最广泛的编码方法。

速率控制输入输出图象分块 DCT变换量化熵编码缓冲运动估计与补偿

12.2 图象分块

在图象压缩编码过程中，DCT变换是对一个一个不重叠的分块图象进行的，所以第一步就是对图象进行分块。假设一帧图象为M点N点象素，我们可以将这样一帧图象分成若干个L点L点（如8 8，16 16等）的子块，M和N必须是L的整数倍。

L L N M

12.3 离散余弦变换DCT

12.4 量化

所谓的量话就是要将某幅度值表示成为有限字长的计算机可存储的数字。例如：=3.14159…，计算机不可能精确表示这样的无限长的浮点数，怎么办？通过量化将该值截断。关于量化有一整套理论，我将在通信原理中予以讲述。

12.5 熵编码

DCT变换经过量化之后，大部分值已经变成0，只有一小部分值不为0。我们可以通过Zig-Zig扫描将一个m点n点的二维序列变成一个mn点一维序列。通过对各图象块进行Zig-Zig编码，我们可以得到一个一维序列

Zig-Zig扫描示意扫描后的一维序列为： 1，0，0，0，2，0，0，0，0，-1，0，0，0，-5，0，0，0 1 2 -5 -1

在Zig-Zig扫描的基础上可以做游程编码，所谓游程编码，就是在前面得到的一维序列中，对所有的非0值编码，编成的码为二维码，（m,n），其中n表示非0值本身，m表示该非0值到前一个非0值之间0的个数。上例经过游程编码可得： (0,1) (3,2)(4,-1)(3,-5)

于是，我们得到了一个二维事件的序列，对这些二维事件而言，出现的概率是不同的，可能某事件（m1,n1）的概率大一些，而某事件（m2,n2）的概率小一些。

因而对这些二维事件可以采用变长编码。变长编码的基本思想是对出现概率大的事件用较短的码表示，而对出现概率小的事件用较长的码表示，从而可以减小平均码长，达到信息压缩的目的。至此图象编码的工作就完成了。

12.6 解码过程

解码过程很简单，接收端只要根据变长码解出二维事件序列，就可以恢复出图象DCT变换的矩阵，再经过IDCT变换就可以恢复图象。当然由于量化是要引入误差的（即计算机有限字长的影响），恢复出的图象与原图象会有较小的差异。

12.7 运动估计和补偿

对于一段每秒25帧的视频流而言，每帧图象之间往往差异不大，用术语来说就是相邻帧间有很强的相关性。如果如实将每帧都采用前面的方法编码传输的话，相当于传输了很多冗余的信息，导致带宽的浪费。运动估计和补偿技术就是为了解决这一问题而出现的技术。

对第k帧中的一小块图象T1，以及第k-1帧中的一小块图象T2，（二者）大小相等。我们可以计算二者之间的差异。假设T1和T2之间的差异最小，我们可以得到一个运动矢量V。 T1 V T2 T2 第k帧第k-1帧图象小块间的差异可以用下面的公式表示

如果我们在第k-1帧中进行全搜索的话我们总可以找到与T1差异最小的图象块，当然这一过程计算量很大。

通过运动估计，我们可以为为当前图象中每一个图象小块从前一时刻的图象中获得一个最相近图象块，并得到一个运动矢量，将两图象块相减，就可以得到一个差值图象块。于是我们只需要将前一帧最相近图象块的编号，运动矢量和差值图象块传到接收端，就可以恢复出一帧图象，而差值图象块可以采用前面介绍的图象编码技术做DCT变换、量化、熵编码。

在接收端显然需要根据发送端发来的信息做运动补偿，首先根据运动矢量将前一帧的图象块移动到相应的位置，然后在加差值图象块。

运动估计与补偿技术尽管需要很大的运算量，但可以实现视频流的极大压缩，所以至今仍是学术界和工业界研究的热点和难点问题。

12.8 混合编码

现在流行的图象压缩的国际标准无一例外地采用变换编码+运动补偿+熵编码的混合编码方案来实现图象以及图象序列（视频流）的压缩。即用DCT变换来消除图象的帧内相关性，用运动补偿来消除图象序列的帧间相关性。用熵编码来提高编码效率。如H.261， H.263， MPEG1， MPEG2

12.9 I、B、P帧编码模式

为了防止运动估计和补偿技术所带来的误差积累问题。在基于DCT变换的图象压缩编码中，一般采用I、B、P帧的编码模式。 P帧是预测帧，它要利用前面紧临的I帧进行运动估计和补偿。 B帧也是预测帧，它与P帧不同的地方在于，B帧要利用前面和后面紧临的两个I帧进行运动估计和补偿

于是编码序列的模式可以表述如下：注：有些图象序列中可能没有B帧 … … 时间 I B B P B I

视频压缩编码为什么不直接对图象帧序列进行，而要将图象帧序列进行DCT变换之后形成二维频域帧序列后再进行？

DCT变换的本质是二维付里叶变换，是一种从二维时域到二维频域的变换方法。从压缩编码的角度来看，我们希望编码的前一级输入中有较多的“0”（通过将较小的数值近似为0实现），以及较好的“0”值连续性。就一帧图象而言，在时域中，图象体现为象素，基本上都是非0值，且0值的连续性不好；而从其频域上看，图象体现为频谱，非0值仅局限于某些频段，而且0值的连续性要比时域好。

12.9 总结

这一章我们介绍了基于DCT编码的图象压缩的基本原理。

我们还明确了一些重要的概念：DCT变换可以消除帧内的信息冗余，运动估计与补偿可以消沉帧间的信息冗余，熵编码的目的是为了提高编码的效率。为了避免运动估计和补偿技术带来的误差积累，一般采用I、B、P帧的编码模式，其中I帧是信息帧；B和P帧是预测帧，存在于两个I帧之间。