19:47:15 H.264中运动估计算法的研究 F99TR 刘伟峰 刘伟峰 Bell Lab.

Slides:



Advertisements
Similar presentations
AIA confidential and proprietary information. Not for distribution. “ 友邦爱心图书馆 ” 项目总结报告 中国区品牌与企业传播部
Advertisements

一、音调  听过女高音和男低音的歌唱吗?他们的声音 给你的印象是怎样的? 女高音:音调高, 男低音:音调低,比较低沉。
第 3 章 聽覺 每章扉頁 3.1 聽覺 3.2 人類耳朵的反應 3.3 聽覺缺陷.
公害污染事件-鉛中毒 認識鉛中毒 鉛中毒的事件 如何解決鉛中毒? A 鄭豪仁 資環二甲 指導老師:胡子陵.
北京大学数字视频编解码技术国家工程实验室 AVS标准工作组,AVS产业技术创新战略联盟
无锡商业职业技术学院 机电工程学院党总支孙蓓雄
2016年全国中级会计资格考试 经济法 主讲老师:葛江静.
AVS视频编码标准 常丽娜 2004/12/06.
中共湖北大学知行学院委员会党校 入党材料规范填写指导 学工处 李华琼 二〇一三年十二月.
老子的素朴 厦门大学计算机科学系 庄朝晖.
第 9 章 多媒體.
心理健康教育 活动设计.
思想道德 修养与 法律基础 沈阳职业技术学院德育法律教研室.
多媒体通信技术 主讲教师:黄玉兰                学时:16.
第八章 诉讼法 第一节 诉讼法概述 第二节 民事诉讼法 第三节 行政诉讼法 第四节 刑事诉讼法.
1890年, 一艘名叫“马尔波罗号”的帆船在从新西兰驶往英国的途中,突然神秘地失踪了。 20年后,人们在火地岛海岸边发现了它。奇怪的是:船体原封未动,完好如初;船长航海日记的字迹仍然依稀可辨;就连那些死去多年的船员,也都“各在其位”,保持着当年在岗时的“姿势”; 1948年,一艘名为“乌兰格梅奇号”的荷兰货船,在通过马六甲海峡时,突然遇到海上风暴,当救助人员赶到时,船上所有人员都莫明其妙地死了。
运动估计基础 陈虎.
运动估计综述.
页眉 一张图分出你是用左脑还是右脑! 如果你看见这个舞女是顺时针转,说明你用的是右脑; 如果是逆时针转,说明你用的左脑。
你是用左脑是右脑?.
提升國小自然與生活科技領域教師教學智能研習
彰化縣西勢國小 學校增能計畫 讀報、剪報與心得寫作教學
通 知 通知是批转下级机关的公文,转发上级机关和不相隶属机关的公文,传达要求下级机关办理和需要有关单位周知或执行的事项,任免人员时使用的公文。
1 西周时期使用_____________作为农业生产工具,采用的耕作方式是_________________
印象派之父 莫內 製作︰林佩葳 指導老師︰袁淑芬老師.
Presenter: 宫曦雯 Partner: 彭佳君 Instructor:姚老师
DM81X 视频采集处理 ——MCFW框架介绍 广州创龙电子科技有限公司
H.264/AVC视频编解码技术概念与实现.
面向对象建模技术 软件工程系 林 琳.
物体识别 3D建图 semantic mapping
Roy Wan PCI MS/s 14-bit 高速数字化仪 Roy Wan
多媒体技术基础(第3版) 第13章 MPEG-4 AVC/H.264视像
SOA – Experiment 3: Web Services Composition Challenge
基于NIM机箱的地下暗物质实验电子学系统研制
P hoto s hop 第一临床学院 08级临床八年 昌金星.
第二章 電腦硬體知識 2-1 電腦的組成與架構 2-2 處理器 2-3 記憶體 2-4 輸入與輸出裝置 2-5 電腦的操作與保養.
混合式浮水印技術應用於H.264/AVC 錯誤偵測及隱匿
时序逻辑电路实验 一、 实验目的 1.熟悉集成计数器的功能和使用方法; 2.利用集成计数器设计任意进制计数器。 二、实验原理
数据挖掘工具性能比较.
应用实例 识别Ps & Pt ADTS 压力通道并校验 CPD8000 New MENSOR‘s ADTS: CPA8001.
多媒体技术 中南大学信息科学与工程学院 黄东军.
使用矩阵表示 最小生成树算法.
姓名XXX.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
微机系统的组成.
顺序表的删除.
现代电子系统设计 第十讲 实验五:数字下变频器 的设计实现 龚玉萍 讲师 无线通信系通信对抗教研室 理工大学通信工程学院.
论文答辩PPT模板 答辩学生:橘子皮 指导老师:PPT工作室.
本节内容 随机读取 视频提供:昆山爱达人信息技术有限公司.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
多媒体技术 中南大学信息科学与工程学院 黄东军.
冷凍空調自動控制 - 控制系統範例 李達生.
LOGIX500软件入门 西安华光信息技术有限公司 2008年7月11日.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
VRP教程 2011.
临界区问题的硬件指令解决方案 (Synchronization Hardware)
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
THERMOPORT 20 手持式温度表 THERMOPORT系列手持温度表基于所用技术及对实际应用的考 虑,确立了新的标准。
本底对汞原子第一激发能测量的影响 钱振宇
第十七讲 密码执行(1).
第十二讲 密码执行(上).
插入排序的正确性证明 以及各种改进方法.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
基于学案制作ppt 录屏工具使用 郑建彬.
香港城市大学 导师: 布礼文教授( Dr. L M Po ) 学生: 徐叙远 ( Xu Xuyuan )
2019/9/19 互联网产业、立法与网规 张钦坤 腾讯法务部.
8的乘法口诀 导入 新授 练习.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
H.264畫框層級之快速模式決策方法 研究生:李明峰 指導教授:蔣依吾 博士 中山大學資訊工程學系
Presentation transcript:

19:47:15 H.264中运动估计算法的研究 F99TR 刘伟峰 刘伟峰 Bell Lab

主要内容: 背景 H.264 层次搜索算法 自适应搜索算法 Bell Lab

背景介绍——谁是继承者? MPEG2老了 谁是继承者? Bell Lab

背景介绍——H.26L横空出世 Bell Lab

背景介绍——来龙去脉 H.26L—ITU-T Q.6/SG16 (VCEG - Video Coding Experts Group)的新宠,H.264的前身 2001 11:VCEG和 MPEG联合组建Joint Video Team (JVT),共同制定H.26L标准 2002 10:完成标准草案 预计2003 标准最终在两个组织获得通过 H.264是该标准ITU-T的官方名称,MPEG方面称它为MPEG4-Part 10 Bell Lab

H.264——基于块的混合编码方式 Bell Lab

运动估计的原理 Bell Lab

H.264中运动估计 更为精细的块尺寸 ¼像素精度的运动矢量 多参考帧 4x4,4x8,8x4,8x8 8x16,16x8,16x16 6阶FIR滤波器插值1/2像素点 双线性插值1/4像素点 线性插值1/8色度像素点 多参考帧 周期运动 镜头、场景的来回切换 Bell Lab

多种多样的块尺寸 Bell Lab

多种多样的块尺寸 Bell Lab

¼像素精度的运动矢量 ½亮度像素点的插值 1/8色度像素点的插值 ¼亮度像素点的插值 Bell Lab

多参考帧 Bell Lab

H.264的性能 JVT/H.264/AVC MPEG-4 MPEG-2 H.263 Foreman QCIF 10Hz 39 38 37 19:47:15 H.264的性能 39 38 37 36 Quality Y-PSNR [dB] JVT/H.264/AVC 35 MPEG-4 34 MPEG-2 33 H.263 32 31 Foreman QCIF 10Hz 30 29 28 27 Bit-rate [kbit/s] 50 100 150 200 250 Bell Lab Bell Lab

H.264 Codec设计复杂度 相对MPEG-2 ,解码复杂度增加 2-3倍,编码复杂度增加 3-4倍 问题: 宏块分得更细(更多的搜索) 预测模式更多(更多的搜索) 多参考帧的运动估计(更多的内存,更多的计算) 更长的滤波器 …… Bell Lab

Lucent Technologies Proprietary and Confidential 编码器的硬件实现方案——ASIC Intra Pred. ME MC Transform Q Inverse T IQ Entropy Coding Pixel Data Pixel Interface Host API Embedded CPU Address Generator De-blocking Filter Output Interface Bit Stream 27MHz PLL Memory Controller Bell Lab Lucent Technologies Proprietary and Confidential

Lucent Technologies Proprietary and Confidential 编码器的硬件实现方案——DSP TMS320DM642 Pixel Intf. MC Reconst Transform Q Inverse T IQ Entropy Coding Controller De-blk Filter Internal Memory Pixel Data BUF Bit Stream ME Intra Pred. Memory Control Internal DDR SDRAM Xilinx FPGA Bell Lab Lucent Technologies Proprietary and Confidential

编码器的硬件实现方案——FPGA Pixel Controller Intf. Transform Q Entropy Coding FIFOs SRAMs Transform Q Inverse IQ De-blocking Filter Entropy Coding Output Ctrl. Internal Memory BUF Bit Stream Pixel Intf. ME Intra Pred. MC Reconst. Memory Ctrl. DDR SDRAM Controller Internal Pixel Data Bell Lab

我们的问题 性能,成本和计算复杂度 选择DSP方案 运动估计计算量无法承受 需要一种快速高效的搜索算法 Bell Lab

层次搜索算法 思想 通过下采样,将图像分辨率降低,先在低分辨的图像上作穷尽搜索,得到最优点X’。然后,回到原图像,在X’的邻域内作进一步的搜索,可以得到局部最优XL。 Bell Lab

层次搜索算法——举例 以下采样2倍为例,设搜索范围是正负48,当前编码块的大小是16x16,则原来要搜索9409个点,每个点的计算量是256次减法,255次加法,1次比较,2倍下采样之后,搜索点数下降1/4,为2401,每个点的计算量是64次减法,63次加法,1次比较,总的计算量只有原来的1/16。白点为下采样后剩下的像素,灰色点是被忽略的点。在得到最优点X’之后,对邻近的8个点(黑点)作进一步的比较,取其最小者作为匹配位置。 Bell Lab

层次搜索算法——实现 由(spiral_search_x[k],spiral_search_y[k])构成了一个可由k索引的点,随着k的增加,这个点沿着原点作类似于螺旋状的运动。0,1,2……数字即为k,数字所在的位置即为点的位置。 有了这样一个数组之后,下采样意味着调整步长,下采样2倍,只要加倍步长就可以了。邻域搜索也就轻而易举了。 Bell Lab

层次搜索算法——性能1 以dec作为输入视频文件 计算平均值 层次搜索算法有5%左右比特率的增加 但是编码时间却有50%—60%的减少 Bell Lab

层次搜索算法——性能2 以dec作为输入视频文件 SNR相差不超过0.1dB 穷尽搜索算法有5%左右比特率优势 但是编码时间却是以级数增长 Bell Lab

层次搜索算法——性能3 以sign_irene作为输入视频文件 观察每一帧性能变化。 性能差异不是十分明显。 Bell Lab

层次搜索算法——结论 适宜硬件以流水线方式实现 适合大屏幕,高分辨率的情况 图像质量不受影响,比特率增加5%左右,编码时间大约减少60% 系统带宽较为宽裕,瓶颈落在计算能力上,层次搜索算法是一种不错的选择 Bell Lab

自适应搜索算法 启发 对于穷尽算法,搜索范围并非越大越好的,如dec,在搜索范围取16时,已经达到了较佳的性能,再增加范围,就是浪费了;在sign_Irene和tempete中,也有类似情况。 对于层次算法,将会有一个最佳的搜索范围,再增加反而会使性能恶化,因为大的搜索范围会增加出错的概率。 如何寻找最佳? Bell Lab

自适应搜索算法 思想 假设运动矢量的预测十分准确,则,只要小范围搜索就可以了。 当有运动物体突变,或镜头切换等情况时(预测失效),搜索范围又能及时地做出调整。 Bell Lab

自适应搜索算法 实现 关键在于这个反馈机制 我的想法:如果前一个宏块的运动矢量处于搜索范围的边缘,或者它的费用高出平均水平很多,就应该适当放大搜索范围,反之,则应缩小搜索范围。 Bell Lab

自适应搜索算法——举例 自适应算法 层次算法sr=16 穷尽算法sr=4,8 Bell Lab

自适应搜索算法——举例 可以看到 自适应算法具 有一定的跟踪 最佳搜索范围 的能力。 Bell Lab

自适应搜索算法 结论 这种想法与ADM是一样的,这样搜索范围能自动调整到最佳状态,始终保持在较小的水平。 在实现上,可以用硬件来实现搜索范围的调整,这样,对软件来说,省下了大量的JUMP指令,可以更快。 还处在探索阶段,有很多实际问题需要解决 Bell Lab

结束语 根据硬件特性,寻找合适的快速算法 本文实现了层次搜索算法,并对其性能作了测评,为工程开发提供了极有价值的参考 受到层次搜索算法的启发,本文又设计了一种自适应的搜索算法,此算法还在进一步的探索之中 但是,到目前为止,所有的工作还只是停留在PC上,没有进一步为特定的硬件,特定的视频内容作优化。 Bell Lab

结束语 视频编码的发展,已历四十年。近年来,又出现了很多新兴的图像压缩编码方法——模型基法,分形法,人工神经网络法等等。 算法同样存在着复杂度大的问题。如何调解性能和计算复杂这对矛盾,是一个很现实,很迫切的问题。 Bell Lab

结束语 相信,随着硬件速度的不断提高,编码算法的不断改进,多媒体网络将会得到更为迅速的发展。 Bell Lab

致谢 首先,向我的毕业设计的指导老师-朱杰表示我的感谢和敬意。在整个毕业设计的过程中,朱老师热情地对我的工作予以了指导,并尽可能地为我提供各种便利条件。同时,我更要感谢的是甘小莺学长和贝尔实验室的阎安、邓航师长,是他们给了我机会、指导和鼓励,并提供大量的资料和宝贵的建议。 Bell Lab

谢谢! QUESTION? Bell Lab