MTI 多媒体技术 第七讲 XIDIAN 国际视频压缩标准简介.

Slides:



Advertisements
Similar presentations
第四章 多媒体数据压缩编码技术 多媒体数据压缩编码技术的重要性和 分类 多媒体数据压缩编码技术的重要性和 分类 量化 统计编码 预测编码 变换编码 多媒体数据压缩编码的国际标准.
Advertisements

「我是剪輯&簡報達人」 --電影教學法在語文領域之應用
MPEG Family.
AVS视频编码标准 常丽娜 2004/12/06.
计算机网络课程总结 一、计算机网络基础 计算机网络定义和功能、基本组成 OSI/RM参考模型(各层的功能,相关概念, 模型中数据传输 等)
第十章 多媒体数据压缩技术 计算机网络与多媒体技术.
第二章 多媒体数据压缩编码技术.
数字视频技术 第七章 视频编码国际标准 2010年11月.
6.1 概述 6.2 信源编码与压缩技术 6.3 信道编码与调制技术
第一次作业知识讲解 我和我的小伙伴们 薛坚、黄进 杨军裕、刘旭宁、李启宏.
第2章 压缩编码技术.
多媒体通信技术 主讲教师:黄玉兰                学时:16.
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
《多媒体应用基础》 第五章 数字视频处理技术 第5章 数字视频处理技术.
第十章 运动图像压缩标准MPEG 10.1 从MPEG1到MPEG7:MPEG标准简述 10.2 MPEG的编码与实现过程
第10章 运动图像压缩标准MPEG 10.1 从MPEG1到MPEG7:MPEG标准简述 10.2 MPEG的编码与实现过程
第1章 多媒体技术概述 多媒体技术及应用基础 计算机教学实验中心 2007.
第十二章 基于DCT变换的 视频压缩编码原理
C++中的声音处理 在传统Turbo C环境中,如果想用C语言控制电脑发声,可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为: Beep(频率,持续时间) , 单位毫秒 暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒 引用这两个函数时,必须包含头文件
张奇 复旦大学计算机科学技术学院 2011年5月 多媒体技术基础(第3版) 第14章 光盘存储器 张奇 复旦大学计算机科学技术学院 2011年5月.
Audio Coding Standards
第十一章 影像與視訊壓縮.
第5章、視訊媒體.
Principle and Application of Digital Television
数字音频技术 曾兰芳 教育技术学院
Hadoop I/O By ShiChaojie.
Overview of Python Visualization Tools
第5章 数字视频 (3).
瑞斯康达—MSG1500 产品类型:路由器 建议零售价格:198元 上市时间:2017 年 3月
多媒體元素.
Mpeg Family 簡介 第六組 B 呂孟庭 B 廖彥鈞.
視訊串流\Streaming Video Part-1 Multimedia on Computer Digital
H.264/AVC视频编解码技术概念与实现.
第9章 声卡与音箱 9.1 声卡 9.2 音箱.
面向对象建模技术 软件工程系 林 琳.
张奇 复旦大学 计算机科学技术学院 2011年5月 多媒体技术基础(第3版) 第12章 MPEG视像 张奇 复旦大学 计算机科学技术学院 2011年5月.
多媒体技术基础(第3版) 第13章 MPEG-4 AVC/H.264视像
管理信息结构SMI.
第一单元 初识C程序与C程序开发平台搭建 ---观其大略
彩色数字电视系统的颜色空间.
AM5728 视频输入端口VIP软件框架 广州创龙电子科技有限公司
逆向工程-汇编语言
CPU结构和功能.
多媒体技术 中南大学信息科学与工程学院 黄东军.
第3章 信息与信息系统 陈恭和.
四川大学 计算机学院 陈 虎 多媒体技术基础 四川大学 计算机学院 陈 虎
VIDEO COMPRESSION & MPEG
C语言程序设计 主讲教师:陆幼利.
晶体管及其小信号放大 -单管共射电路的频率特性.
VisComposer 2019/4/17.
晶体管及其小信号放大 -单管共射电路的频率特性.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
姚金宇 MIT SCHEME 使用说明 姚金宇
信号量(Semaphore).
多媒体技术 中南大学信息科学与工程学院 黄东军.
数据集的抽取式摘要 程龚, 徐丹云.
音频处理及数字化.
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
滤波减速器的体积优化 仵凡 Advanced Design Group.
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
THERMOPORT 20 手持式温度表 THERMOPORT系列手持温度表基于所用技术及对实际应用的考 虑,确立了新的标准。
基于列存储的RDF数据管理 朱敏
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
数字图像处理 北京大学计算机研究所 陈晓鸥.
第十七讲 密码执行(1).
第十二讲 密码执行(上).
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
四路视频编码器 快速安装手册 1、接口说明 2、安装连接 3、软件下载 4、注意事项 编码器软件下载地址
Presentation transcript:

MTI 多媒体技术 第七讲 XIDIAN 国际视频压缩标准简介

主要内容 视频压缩标准发展历史 H.26X系列压缩标准简介 MPEG系列压缩标准简介

视频压缩标准发展历史 ITU: ISO/IEC: H.261 H.262 H.263 H.263+ H.264 MPEG1 MPEG2 MPEG4 (Part2) MPEG4(Part10) MPEG7 MPEG21

视频压缩标准对比 时间 输入 输出 压缩率 压缩算法 应用 H.261 p×64kb/s视频编码标准 1990年12月 176×144(QCIF) 352×288(CIF) 帧速率可变<=30 输出 p×64kb/s(p=1,2,…,32) 压缩率 20~30 小于MPEG1 压缩算法 运动补偿帧间预测与分块DCT相结合的混合编码 应用 可视电话、视频会议等对称应用

视频压缩标准对比(续) 时间 输入 输出 压缩率 压缩算法 应用 MPEG1 数据传输速率为1.5Mb/s的数字存储媒体运动图像及其伴音编码标准 时间 1993年8月 输入 视频:352×240×30,352×288×25 音频:32、44.1、48kHz的线性PCM 输出 1.5Mb/s、32-384 Kb/s(音频) 压缩率 20~30 压缩算法 运动补偿帧间预测(单向预测+双向预测)+DCT 应用 VCD、MP3、局域网视频传输

视频压缩标准对比(续) 时间 输入 输出 压缩率 压缩算法 应用 MPEG2H.262 运动图像及其伴音通用编码标准 1994年11月 352×288~1920×1152 采用频率为16、22.05、24、32、44.1、48kHz的线性PCM、支持5.1声道 输出 1.5-80Mb/s、8-640 Kb/s(音频) 压缩率 30-40 压缩算法 运动补偿帧间预测(单双向预测)+DCT、可伸缩性、前向兼容 应用 DVD、DVB、HDTV

视频压缩标准对比(续) 时间 输入 输出 压缩率 压缩算法 应用 H.263 H.263+ 甚低码率通信的视频编码标准 1996年3月、1998年1月 输入 QCIF、CIF、128×96(SubQCIF)、704×576(4CIF)、1408×1152(16CIF) 输出 30kb/s~ 压缩率 H.263+>H.263>MPEG2 压缩算法 运动补偿帧间预测(单双向预测)+DCT 局部算法改进 可伸缩性 应用 通用电话交换网、局域网的视频通信

视频压缩标准对比(续) 时间 输入 输出 压缩率 压缩算法 应用 MPEG4(Part 2) MPEG4 Visual 甚低码率活动图像及其伴音编码标准 时间 1999年 输入 ≧176×144的多种分辨率格式 输出 4.6Kb/s~64Kb/s 压缩率 ≧ 100 压缩算法 基于对象的新一代编码技术,注重交互性,即可包含自然对象,又可包含人工合成对象 应用 可应用范围很广、目前多用于因特网视频传输、流媒体应用

视频压缩标准对比(续) 时间 输入 输出 压缩率 压缩算法 应用 H.264 MPEG4(Part10) MPEG4 AVC 2003年5月 多种分辨率格式 输出 压缩率 压缩率最高的视频压缩标准,比MPEG4 Visual节约50%的码率 压缩算法 基于传统框架的混合编码系统,只是做了局部优化。更注重编码效率和可靠性 应用 视频广播、视频通信和存储媒体(CD DVD)等多种应用

MPEG-1视频压缩标准 MPEG-1标准号为ISO/IEC 11172,它由五部分组成: MPEG-1系统( MPEG-1 Systems ):规定视频数据、声音数据及其他相关数据的同步合成技术 MPEG-1视频编码标准(MPEG-1 Video) MPEG-1音频编码标准(MPEG-1 Audio) MPEG-1一致性测试:详细说明如何测试比特数据流和解码器是否满足MPEG-1前3个部分(Part1,2和3)中所规定的要求。 MPEG-1软件模拟:一个技术报告,给出了软件执行MPEG1前3个部分的运行结果。

MPEG-1视频压缩标准 输入、输出指标: MPEG视频 编码器 352×288×25×8×1.5 30Mb/s 1.15Mb/s 352×240×30×8×1.5 26 : 1

MPEG1视频压缩算法 运动补偿帧间预测(temporal) + DCT(spatial)

Frame 1

Frame 2

Residual Frame

象素运动轨迹

Block-based Motion Estimation and Compensation

Block-based Motion Estimation and Compensation

16×16 Block Size

8×8 Block Size

4×4 Block Size

Sub-pixel Motion Estimation and Compensation 子像素运动估值与补偿

Sub-pixel Motion Estimation and Compensation

MPEG1视频编码器框架

MPEG1视频编码器框架 分块

MPEG1视频压缩算法 分割: 运动图像序列 图片组(GOP) 图片 条(Slice) 块(Block) 宏块 Macro Block I … 图片 条(Slice) 块(Block) 8 宏块 Macro Block 16 8 16

MPEG1视频压缩算法 GOP的组成: I:内帧 P:单向预测帧 B:双向预测帧 一个内帧是一个随机访问点。B图像不能作为其它图像的参考帧。

MPEG1视频压缩算法 为了在图像质量和数据速率之间作出调整,MPEG编码器允许(1)选择内帧I的频率和位置,(2)选择I和P之间双向预测帧B的数目。 视频类型 I P B 平均 MPEG-1 CIF 150000b 50000b 20000b 38000b MPEG-2 601 400000b 200000b 80000b 130000b

MPEG1视频压缩算法 运动补偿技术在宏块一级工作。宏块分为四类: 帧内宏块,简称I块 前向预测宏块,简称F块 后向预测宏块,简称B块 平均宏块,简称A块 I图像只包含I块,P图像只包含I块和F块,B图像可以包含4种类型的宏块。

MPEG1视频压缩算法 I图像帧的压缩算法: 在空间方向上(内帧),MPEG-1压缩采用JPEG压缩算法来去掉冗余信息。

MPEG1视频压缩算法 P图像帧的压缩算法: 对于P宏块,MPEG-1采用运动补偿帧间预测算法来去掉时间轴上的冗余信息。

MPEG1视频压缩算法 运动矢量的概念

MPEG1视频压缩算法 基于块的运动矢量估值算法——块匹配法

MPEG1视频编码算法 块匹配法(Block Matching Algorithm)需要解决两个关键问题: (1)匹配准则 (2)搜索算法

MPEG1视频编码算法 BMA中常用的匹配准则: 绝对值: 均方误差: 平均绝对帧差:

MPEG1视频编码算法 BMA常用搜索算法—二维对数搜索法:

MPEG1视频编码算法 BMA常用搜索算法—三步搜索法:

MPEG1视频编码算法 BMA常用搜索算法—对偶搜索法:

MPEG1视频编码算法 B图像帧的压缩算法:

MPEG-1 音频压缩标准 输入、输出指标: MPEG音频 编码器 32kHz, 44.1kHz, 48kHz 32kb/s~ 16位 PCM 层次 压缩率 数据速率kb/s 延迟(ms) 1 4 : 1 384 19/50 2 6:1 ~ 8:1 192 ~ 256 35/100 3 10:1 ~ 12:1 112 ~ 128 59/150

MPEG-1 音频压缩算法 听觉系统的感知特性: 听阈-频率曲线

MPEG-1 音频压缩算法 听觉系统的感知特性: 一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽

MPEG-1 音频压缩算法 听觉系统的感知特性: 在时间上相邻的声音之间也有掩蔽现象,称为时域掩蔽。时域掩蔽又分为超前掩蔽和滞后掩蔽。 一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽

MPEG-1 音频压缩算法 感知子带压缩算法 算法以心理声学模型为基础,主要利用了听觉阈值和听觉掩蔽特性

MPEG-1 音频压缩算法 感知子带压缩算法 1、将音频信号用滤波器组分成32个子带; 2、用FFT将子带变换到频率域 3、根据心理声学模型估计各个子带的感知阈值 4、根据对感知阈值的估计对各个子带进行比特分配和量化。 MP3采用了与MP1、MP2不同的滤波器和心理声学模型。

MPEG-1 音频压缩算法 MPEG-1 Audio层1和层2编码器和解码器的结构

MPEG-1 音频压缩算法 MPEG-1 Audio层3编码器和解码器的结构

H.261概述 H.261也称P×64,这是ITU-T(前身为CCITT)最早制定的关于视频编码的国际标准。考虑到ISDN的传输码率以64kbps为单位,因此以p×64kbps(p=1~30)作为为H.261的标准码率。H.261标准主要用于电视电话和电视会议。它支持QCIF(p=1、2)、CIF(p>2)两种图像输入格式。

H.261解决的问题 第一是编码算法问题。确立了一种合理的、保证图像质量且为各国图像编码专家所公认的统一的算法。算法必须能够实时操作,解码延时要短。 第二是与PCM标准兼容的问题。编解码器以64~1920kb/s的工作速率去覆盖N-ISDN或PCM一次群的通道。 第三,解决电视制式不同的问题。为了使同一标准既能用于PAL(625)和NTSC(525)两种电视制式系统,源编码基于中间格式CIF格式,所以输入输必须 经转换到CIF或QCIF格式再进行源编码。

视频编码图像格式一览表

H.261的信源编码框架

H.261的信源编码算法 一、将预测误差或输入图像划分成为8*8的象素块。进一步,将4个亮度像块和两个在空间位置上与之重叠的色差像块符合成一个16*16的宏块(MB)。 二、对于帧序列中的第一副图像或景物变换后的第一副图像,采用帧内变换编码:利用8*8的DCT实现。各DCT系数经过线性量化、变长编码后进入缓冲器,根据缓冲器的上溢和下溢,来反馈调节量化器的量化步长,以控制视频编码位流使之与信倒速率相匹配。

H.261的信源编码算法 帧间预测采用混合方法:利用运动补偿预测,当预测误差超过某个门限后,对误差做DCT、视觉加权量化及熵编码。运动矢量信息编码后也送到缓冲器中。DCT去除空间冗余度,而使用有运动补偿的帧间预测来去除时间上的冗余。这是一个典型的帧内/帧间自适应预测加DCT变换的混合算法。

H.261的图像复用编码 H.261源编码后进行图像复用编码, 实际上是把比特流分成图像(Picture),像块组 (GOB:Group of blocks),宏块(MB:Macroblock)和像块(Block),并附加相应的信息。按照CIF格式,每帧CIF图像包含12个GOB,每个GOB包含33个MB,每个MB包含4个亮度数据块和各1个Cb 、Cr色度块,每个B包含8*8象素。

H.261的图像复用编码 H.261 数据流结构

H.261视频压缩算法 利用二维DCT减少图像的空间域的冗余度; 利用运动补偿预测减少图像的时间域冗余度; 利用视觉加权量化减少图像"灰度域"的冗余度; 利用熵编码来减少图像的"频率域"的冗余度。

H.261与MPEG-1的对比

MPEG-2 通用视频压缩标准 MPEG-2的标准号为ISO/IEC 13818,它主要由以下几部分组成: MPEG-2系统( MPEG-1 Systems ) MPEG-2视频编码标准(MPEG-2 Video) MPEG-2音频编码标准(MPEG-2 Audio) MPEG-2高级音频编码标准(MPEG-2 AAC) 与MPEG-1一样,MPEG-2只规定了码流结构和解码器算法规则,而把实际编码器模型向设计者开放,以提供更多的选择性和自由度。

MPEG-2 Video (1)能够在很宽的范围内对不同分辨率和不同输出比特率的图像信号有效的进行压缩。 MPEG-2 Video与MPEG-1的基本编码算法相同,只是增加了如下功能: (1)能够在很宽的范围内对不同分辨率和不同输出比特率的图像信号有效的进行压缩。 (2)处理隔行扫描的视频信号的能力。 (3)多样化的取样模式:4:2:0,4:2:2,4:4:4 (4)可伸缩(Scalable)的视频编码模式: Ⅰ 编码时可以在图像质量和数据速率之间作出调整 Ⅱ 解码时只对码流的一部分进行解码和对码流的全部进行解码能够分别获得不同质量的重建图像。

可伸缩性编码模式 (1)信噪比伸缩性(Signal-to-Noise Scalability) (2)空间分辨率伸缩性(Spatial Scalability) (3)时间分辨率伸缩性(Temporal Scalability)

MPEG-2 Video 为了适应不同应用的需要,MPEG-2引入了配置(profiles)和等级(levels)的概念,每种配置定义一套新的算法,而每一个等级指定一套参数范围(如图像大小、帧速率和位速率)。

MPEG-2 Video MPEG-2的配置 配置(profile) 特征 简单(Simple) 基本(Main) 信噪比可变 4:2:0取样,仅用I、P帧,支持随机存取,不支持可伸缩性 基本(Main) 以上参数,加上支持B帧 信噪比可变 以上参数,加上信噪比可变性 空间分辨率可变 以上参数,加上空间分辨率可变性 高档(High) 以上参数,4:2:2采样方式

MPEG-2 Video MPEG-2的等级 等级(level) 特征 低级(Low) 基本级(Main) 高级(High)1440 352×288,30帧/s,1.2Mb/s 基本级(Main) 720×576,30帧/s,4~15Mb/s 高级(High)1440 1440×1152,60帧/s,60Mb/s 高级(High) 1920×1152,60帧/s,80Mb/s

MPEG-2 Video MPEG-2的配置与等级的组合 配置 Profile 等级 低 中 高1440 高1920 简单 ● 基本 信噪比 空间 高

MPEG-2 Audio MPEG-2标准委员会定义了两种声音数据压缩格式: (1)MPEG-2 Audio,或者称为MPEG-2多通道(Multichannel)声音,它与MPEG-1 Audio是兼容的,所以又称为MPEG-2 BC (Backward Compatible)。 (2)另一种称为MPEG-2 AAC (Advanced Audio Coding),因为它与MPEG-1声音格式不兼容,因此通常称为非后向兼容MPEG-2 NBC(Non-Backward-Compatible)标准。

MPEG-2 BC Audio MPEG-2 BC Audio和MPEG-1 Audio标准都使用相同种类的编译码器,层-1, -2和-3的结构也相同。MPEG-2声音标准与MPEG-1标准相比,MPEG-2做了如下扩充: (1)增加了16 kHz, 22.05 kHz和24 kHz采样频率 (2)扩展了编码器的输出速率范围,由32~384 kb/s扩展到8~640 kb/s (3)增加了声道数,支持5.1声道和7.1声道的环绕声。 (4)MPEG-2还支持Linear PCM(线性PCM)和Dolby AC-3(Audio Code Number 3)编码

MPEG-2 AAC AAC支持的采用频率可从8 kHz到96 kHz,AAC编码器的音源可以是单声道的、立体声的和多声道的声音。AAC标准可支持48个主声道、16个低频音效加强通道LFE (low frequency effects)、16个配音声道(overdub channel)或者叫做多语言声道(multilingual channel)和16个数据流。MPEG-2 AAC在压缩比为11:1,即每个声道的数据率为(44.1×16 )/11=64 kb/s,而5个声道的总数据率为320 kb/s的情况下,很难区分还原后的声音与原始声音之间的差别。与MPEG的层2相比,MPEG-2 AAC的压缩率可提高1倍,而且质量更高,与MPEG的层3相比,在质量相同的条件下数据率是它的70%。

H.262 标准 ITU-T 于1990年成立了“ATM视频编码专家组”,负责制定适用于B-ISDN信道ATM编码传输标准。该专家组于1993年11月与ISO的MPEG专家组联合提出了H.262建议草案(MPEG-2),用于数字存储介质和数字视频通信中图像信息的编码表示和解码规定。该标准向下兼容,能够在很宽的范围内对不同分辨率和不同输出比特的图像信号有效的进行压缩。

H.263/H.263+/H.264 这些标准的编解码框架与H.261和MPEG-1类似,也是基于混合编码的方案,只是做了如下改进以大幅度降低码率: 1、先进的帧内编码技术 2、灵活的运动补偿技术: (1)匹配块尺寸可变(16×16、 16×8、 8×16、 8×8、 8×4、 4×8、 4×4 ) (2)运动矢量可精确到1/2或者1/4象素 (3)多参考帧预测 (4)无约束运动矢量 3、先进的去块滤波技术 4、整数DCT变换 。。。。。。。

MPEG-4 视频压缩标准 MPEG-4从1994年开始工作,目标是为视听(audio-visual)数据的编码和交互播放开发算法和工具,它是一个数据速率很低的多媒体通信标准。MPEG-4 算法的核心是支持基于内容的(content-based)的编码和解码功能,也就是对场景中使用分割算法抽取的单独的物理对象进行编码和解码。

MPEG-4 视频压缩标准

MPEG-4 视频压缩标准

MTI XIDIAN 结束