运动估计综述.

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
1 计算机软件考试命题模式 计算机软件考试命题模式 张 淑 平 张 淑 平. 2  命题模式内容  组织管理模式 − 命题机构和人员组成 − 命题程序  试卷组成模式.
碰撞 两物体互相接触时间极短而互作用力较大
碰撞分类 一般情况碰撞 1 完全弹性碰撞 动量和机械能均守恒 2 非弹性碰撞 动量守恒,机械能不守恒.
分式的乘除.
运动估计基础 陈虎.
小学生游戏.
第10章 运动分析.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第十二章 基于DCT变换的 视频压缩编码原理
在PHP和MYSQL中实现完美的中文显示
19:47:15 H.264中运动估计算法的研究 F99TR 刘伟峰 刘伟峰 Bell Lab.
Overview of Python Visualization Tools
强连通分量 无向图 1、任意两顶点连通称该图为连通图 2、否则将其中的极大连通子图称为连通分量 A D C B E 有向图
物体识别 3D建图 semantic mapping
基于全方位视觉的多人体运动检测跟踪 利用全方位摄像机获取360˚ 的环境信息,在室内对多个人体目标进行实时运动检测。
第4章 非线性规划 一维搜索方法 2011年11月.
Online job scheduling in Distributed Machine Learning Clusters
What have we learned?.
第十章 方差分析.
数据挖掘工具性能比较.
应用实例 识别Ps & Pt ADTS 压力通道并校验 CPD8000 New MENSOR‘s ADTS: CPA8001.
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
搜 刘智 iLife信息素养协会 索.
UI 软件 设计 页面布局(三).
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
简单介绍 用C++实现简单的模板数据结构 ArrayList(数组, 类似std::vector)
微机系统的组成.
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
顺序表的删除.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
论文答辩PPT模板 答辩学生:橘子皮 指导老师:PPT工作室.
模型分类问题 Presented by 刘婷婷 苏琬琳.
本节内容 随机读取 视频提供:昆山爱达人信息技术有限公司.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
VisComposer 2019/4/17.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
用计算器开方.
Web安全基础教程
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
多媒体技术 中南大学信息科学与工程学院 黄东军.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
2019/5/21 实验一 离散傅立叶变换的性质及应用 实验报告上传到“作业提交”。 11:21:44.
实验二 基尔霍夫定律 510实验室 韩春玲.
基于列存储的RDF数据管理 朱敏
异分母分数加、减法.
找 因 数.
第8章 创建与使用图块 将一个或多个单一的实体对象整合为一个对象,这个对象就是图块。图块中的各实体可以具有各自的图层、线性、颜色等特征。在应用时,图块作为一个独立的、完整的对象进行操作,可以根据需要按一定比例和角度将图块插入到需要的位置。 2019/6/30.
信息学院计算机专业021 学号:024100132 姓名:魏中州.
第十七讲 密码执行(1).
第十二讲 密码执行(上).
插入排序的正确性证明 以及各种改进方法.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
三角 三角 三角 函数 余弦函数的图象和性质.
香港城市大学 导师: 布礼文教授( Dr. L M Po ) 学生: 徐叙远 ( Xu Xuyuan )
§4.5 最大公因式的矩阵求法( Ⅱ ).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
第三章 图形的平移与旋转.
学习目标 1、什么是列类型 2、列类型之数值类型.
9.3多项式乘多项式.
Presentation transcript:

运动估计综述

图像的冗余 视频序列图像在时间上存在很强的相关性,采用运动估计和运动补偿技术可以消除时间冗余以提高编码效率,这种技术广泛用于视频压缩的一些国际标准中,如H.261/263/264、MPEG-1/2/4。

运动估计的分类 全局运动估计 基于象素点的运动估计 基于块的运动估计 基于区域的运动估计 基于网格的运动估计 时域运动估计 频域运动估计(DFT、DCT、DWT)

运动估计的分类 a 全局运动估计 b 基于象素点的运动估计 c 基于块的运动估计 d 基于区域的运动估计

运动估计的分类 a 基于块的运动估计 b 基于网格的运动估计 块匹配运动估计因算法简单、便于硬件实现得到广泛应用,本文将对其进行重点讨论,下面简称其为“运动估计”。

运动估计的定义 基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有象素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。视频压缩的时候,只需保存运动矢量和残差数据就可以完全恢复出当前块。

匹配准则 常见的运动估计匹配准则有三种:MAD、MSE和NCCF,由于MAD没有乘除操作,不需做乘法运算,实现简单方便,所以使用较多。通常使用求和绝对误差(SAD)代替MAD 。

全搜索法 对搜索区域的所有 位置进行穷尽搜索。 精度最高 计算复杂,难以实时 处理 必须研究相应的运动 估计快速算法

运动估计快速算法分类 分层的和多分辨率的快速块匹配方法 基于连续消除的快速块匹配方法 基于象素子抽样的快速块匹配方法 固定搜索模式的快速块匹配方法 基于时空相关性和视觉特性的快速块匹配方法

分层的或多分辨率法 缺点:计算过程复杂,内存需求较大。 在较粗糙的分辨率下预测一个接近的大尺寸的运动矢量,然后在较高的分辨率下进一步修正。称为分层的或多分辨率的运动估计快速算法。 缺点:计算过程复杂,内存需求较大。

连续消除法

象素子抽样法 通常的匹配准则是把块里所有的象素点进行计算和比较,事实上一个块里相邻象素的差别很小,使得它们之间也存在冗余。子采样运动估计算法就利用了这一事实,只取其中的一部分象素进行计算,可大大减少计算量,但同时降低了准确性。

固定模式法 该方法假设匹配误差随着离全局误差最小点的距离增加而单调增加。一般从原点开始,采用固定的搜索模板和搜索策略得到最佳匹配块。著名的算法有:三步法、梯度下降法、四步法、菱形法、六边形法等,下边将分别予以介绍。

三步法 搜索模板半径依次减半 对小运动检测效果不好 搜索范围大于7时,搜索步骤不止三步

梯度下降法 反复使用3×3模板进行搜索。模板中心处SAD值最小时结束。 对大运动检测效果不好

四步法 反复使用5×5方形模板进行搜索。模板中心处SAD值最小时再用3×3模板搜索一次确定最佳匹配位置。

菱形法 搜索方式与四步法类似,只是搜索模板换为两个菱形模板。

六边形法 搜索方式与菱形法类似,只是大搜索模板换为一个六边形模板。

固定模式搜索法的缺点 以菱形法为例,对背景图像,也要经历从大模板到小模板的转换过程,至少需要13个搜索点,搜索速度还有待改进。 没有利用图像本身的相关信息,不能根据物体运动的剧烈程度自适应的改变搜索起点和搜索半径。 以菱形法为例,对背景图像,也要经历从大模板到小模板的转换过程,至少需要13个搜索点,搜索速度还有待改进。 对于运动剧烈的图像,从原点开始搜索时,要经过多次搜索才能找到匹配点,搜索点过多,且容易陷入局部最优点。

序列相关性和视觉特性 预测搜索起点 扁平搜索模板 背景图像快速检测 多预测点搜索 针对固定模式法的不足,近几年来,人们针对序列图像的时空相关性和人眼视觉特性,提出了许多改进算法,主要可分类下面几类: 预测搜索起点 扁平搜索模板 背景图像快速检测 多预测点搜索

预测搜索起点 利用相邻块之间的运动相关性选择一个反映当前块运动趋势的预测点作为初始搜索点,这个预测点一般比原点更靠近全局最小点。从预测点开始搜索可以在一定程度上提高搜索速度和搜索精度。可参考预测搜索法(PSA)、自适应运动跟踪法(AMTS)。

扁平搜索模板 在序列图像中,大多数的运动矢量都位于水平或垂直方向,因此有些论文设计了扁平搜索模板(非对称搜索模板)来加快搜索速度。可参考十字菱形搜索法(CDS)。

背景图像的快速检测 由于一般序列中背景图像占有相当的比例,对背景图像的快速检测对搜索算法的性能提高很大。一般有两种方法: 中止判别条件(门限一般设置512左右) 从中心点开始用小模板检测,可参考CDHS算法

多预测点搜索 这种方法是根据邻块运动矢量预测多个搜索点,在搜索过程中选择预测性能最好的预测点,通常于小模板搜索方法想结合。可参考自适应十字模式搜索(ARPS)及其改进算法。 预测方法至关重要。

H.264标准中运功估计的新特点 多帧参考 ¼象素预测精度 多块尺寸

多帧参考

帧间运动矢量复用

¼预测精度

亚象素全搜索法

亚象素快速搜索(一)

亚象素快速搜索(二)

多块尺寸

H.264的性能优势和计算复杂度 在相同的图像质量下,H.264所需码率约为MPEG-2的36%、H.263的51%、MPEG-4的61%,在很大程度上应归功于运动估计的这三个新特性。 但是,H.264的高性能是以计算复杂度为代价的。以运动估计为例,1/4象素预测需要大量的象素插值和匹配点运算,运动估计的计算复杂度还随参考帧和分块方式呈线性增加。而H.264中参考帧最多支持16个,分块模式共有7种,极大地增加了处理器的运行负担。 因此,研究基于H.264的运动估计快速算法,是H.264标准走向实时应用的关键。