AVS视频编码标准 常丽娜 2004/12/06
视频压缩标准 MPEG: Moving Pictures Experts Group的缩写。 运动图像专家组是在1988年由ISO成立的,目的是制定一种音频视频解压缩系统。MPEG-1和MPEG-2在1992年制定出来,MPEG-4于1998 年11 月公布,它不仅是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。 H.264: 由 JVT(Joint Video Team,视频联合工作组)制定,该组织于2001年12月在泰国Pattaya成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。
视频压缩的关键技术 运动图像压缩技术基本思想和方法可以归纳成两个要点: 关键技术 在空间方向上,图像数据压缩采用静态图像压缩算法来去除冗余信息。如变换、量化、帧内预测等。 在时间方向上,图像数据压缩采用运动补偿(motion Compensation ) 算法来去掉冗余信息。帧间预测 关键技术 变换 量化 编码 帧内预测 帧间预测
变换 因为在一幅图像中像素之间的灰度或色差信号变化缓慢,8*8子块中像素之间相关性很强,所以通过离散余弦正交换处理后,在空间频率低频范围内集中了数值大的系数,这样为数据压缩提供了可能。
量化 为了达到压缩数据的目的,对DCT系数F(u,v)需作量化处理,量化处理是在一定的主观保真度图像质量的前提下,丢掉那些对视觉效果影响不大的信息。不同频率的余弦函数对视觉影响不同,所以可根据不同频率的视觉阐值来选择量化表中的元素值的大小。 DCT变换系数F(u,v),除以量化表中对应位置的量化步长,其幅值下降,动态范围变窄,高频系数的零值数目增加。
编码 DCT变换之后的64个变换系数经量化后,坐标u=v=0的值是直流分量,称为DC系数。其余63个变换系数是交流分量,称为AC系数。 为了进一步达到压缩数据的目的,需对量化后的DC系数和AC系数进行基于统计特性的熵编码。比较常被采用的熵编码方法有Huffman、VLC、CABAC(Context Adaptive Binary Arithmetic Coding)及PCM预测编码等。
帧间预测 帧间预测编码时要用到先前的图,当前的预测图又往往作为后来预测图的参考值。 运动补偿:运动补偿是以子块作为预测单元,把当前子块认为是先前某一时刻图像子块的位移,位移包括运动方向和运动幅度。
AVS标准 AVS 简介 AVS 视频编码关键技术(V1.0) 变换/量化 帧内预测/帧间预测 熵编码 环路滤波 AVS-M应用与技术需求
AVS标准 AVS标准工作组目的是为了制定一系列面向应用、市场的音视频编码标准及其系统、安全等方面的规范 第二阶段(AVS-M):面向移动设备,正在进行,已开过两次会议 AVS视频标准(V1.0)的制定过程 方案的讨论与确定(02年8月到12月) 两种可能 与H.264的基本层兼容 完全独立的方案 技术的征集和评估(02年12月至今)
AVS标准 - 编码控制 控制数据 变换/量化 量化后的 变换系数 解码器 反量化 反变换 熵编码 帧内 预测 运动补偿 预测 帧内/帧间 环滤波 运动补偿 预测 帧内/帧间 运动 数据 运动估计
AVS视频标准 技术征集 技术类型 征集技术 帧间和帧内预测技术 (Inter & Intra Prediction) B Frame(清华) Interlace(清华) Sub-pixel Interpolation(浙大) MV Prediction & Coding(北工大,北航) Intra Prediction(清华) Skip Mode (计算所) 变换和量化 (Transform & Quantization) Wavelet Transform (Integer)(华工) DCT(计算所,北工大) 变换系数扫描 (Coefficient Scan) Alternate Scan(计算所) 熵编码器(Entropy Coding) VLC(华工,计算所,北航) CABAC 滤波器(Filtering) In-loop deblocking filter(华工,浙大,自动化所) 文件格式(File Format) start code(华为) High-level syntax(华为)
AVS视频标准 采纳的关键技术提案 DCT变换和量化 熵编码 开始码 基于上下文的2D VLC熵编码器 (计算所) 8x8整数变换及量化[10 9 6 2] (浙大) 熵编码 基于上下文的2D VLC熵编码器 (计算所) 宏块类型及CBP的联合编码(计算所) 逸出码预测编码方法(浙大) 开始码 一种把音视频编码数据封装为可随机访问数据流的方法 (上广电)
AVS视频标准 采纳的关键技术提案 帧内预测 B帧预测 插值 环路滤波 简单的帧内预测实现(北工大) 一种新型帧间预测方法(计算所) Direct mode运动矢量舍入控制(计算所) 插值 一种分像素插值滤波方法(计算所) 环路滤波 简单的环路滤波实现(计算所、北工大、华中科技)
AVS视频标准 采纳的关键技术提案 运动矢量预测 基于块的运动矢量预测 (计算所) 视频编码结构 视频序列结构(清华)
AVS视频标准 特点 高效 复杂度低 兼容现有MPEG-2系统 比MPEG-2编码效率高2倍 与H.264编码效率相当 最多2个参考图像 最小的运动补偿块为8x8 没有许多在HD-TV和HD-VD应用中不需要的编码工具 兼容现有MPEG-2系统 现有的电视台的基于MPEG-2编辑和传输系统不需要改变
AVS 视频编码标准 AVS (V1.0)关键技术介绍 变换/量化 帧内预测/帧间预测 熵编码 环路滤波
变换与量化 浮点DCT: AVS中的8*8整数DCT变换 Y = TXTA, T =
帧间预测 宏块划分模式: 运动矢量预测:编码当前块的差分运动矢量 MVDE= MVE- PMVE
帧间预测 A a 1 b B c d e f 2 h 3 i 4 j k l m C 5 D 新的滤波方案 半像素插值: (-1/8,5/8,5/8,-1/8) 1/4像素插值: (1/16,7/16,7/16,1/16) 色度采用1/8双线型插值 A a 1 b B c d e f 2 h 3 i 4 j k l m C 5 D
帧间预测 新型的双向预测模式: Symmetric mode 只编码一个前向运动矢量, 后向运动矢量根据帧间距离推导得出 在两个方向同时搜索得到最优的运动矢量. BMV = -FMV*d2/d1
熵编码 采用指数哥伦布码进行编码 1 0 010 1 011 2 00100 3 …………. ….
环路滤波 简单的环路滤波 Intra 宏块边界(1,2,1) Inter 宏块边界(1,-3,3,-1) 例:P0 = (p1 + 2xp0 + q0 + 2)>>2 Inter 宏块边界(1,-3,3,-1)
AVS-M 时间:至年底视频部分基本完成 应用: 技术需求: 考虑信道 不考虑信道 编码效率高 解码复杂度低 容错功能,抗误码 多媒体信息服务(Multimedia Message Servers):彩信业务等 流媒体和广播(Streaming and Broadcasting):手机电视 实时通讯(Real-time communication):可视电话,视频会议等。 不考虑信道 本地播放(Local Playback):用户可以在无法实现无线网络接入的条件下(如在飞机上),播放本地存储的音视频文件。 采集编码 (Record): 用户可以通过移动手持设备实现视频采集和编码。 技术需求: 编码效率高 解码复杂度低 容错功能,抗误码
AVS-M应用示范