关于自底向上的显著性方法的综述报告人：周静波 2012年08月30日.

Slides:

Advertisements

Similar presentations

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

§3.4 空间直线的方程.

《解析几何》－Chapter 3 §7 空间两直线的相关位置.

3.4 空间直线的方程.

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

第四章　函数的积分学第六节　微积分的基本公式一、变上限定积分二、微积分的基本公式.

§5.3 定积分的换元法和分部积分法一、定积分的换元法二、定积分的分部积分法三、小结、作业.

第5章定积分及其应用基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法

不确定度的传递与合成间接测量结果不确定度的评估

1.5 场函数的高阶微分运算 1、场函数的三种基本微分运算标量场的梯度f ，矢量场的散度F 和F 旋度简称 “三度” 运算。

2-7、函数的微分教学要求教学要点.

C++中的声音处理在传统Turbo C环境中，如果想用C语言控制电脑发声，可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为： Beep(频率,持续时间) , 单位毫秒暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒引用这两个函数时，必须包含头文件

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

强连通分量无向图 1、任意两顶点连通称该图为连通图 2、否则将其中的极大连通子图称为连通分量 A D C B E 有向图

显著物体分割探秘与思考 Yin Li, Georgia Tech

物体识别 3D建图 semantic mapping

卢湖川大连理工大学基于稠密和稀疏重构的图像显著性检测算法 Xiaohui Li, Huchuan Lu, Lihe Zhang, Xiang Ruan, Minghsuan Yang,

基于全方位视觉的多人体运动检测跟踪利用全方位摄像机获取360˚ 的环境信息，在室内对多个人体目标进行实时运动检测。

计算机数学基础主讲老师: 邓辉文.

EM算法一种参数估计的方法.

数学模型实验课（三）插值与三维图形.

第十章方差分析.

实验六积分器、微分器.

基于规则抽取的时间表达式识别.

工业机器人技术基础及应用主讲人：顾老师

使用矩阵表示最小生成树算法.

工业机器人技术基础及应用主讲人：顾老师

若2002年我国国民生产总值为亿元，如果，那么经过多少年国民生产总值每年平均增长是2002年时的2倍？解：设经过年国民生产总值为2002年时的2倍, 根据题意有，即.

抽样和抽样分布基本计算 Sampling & Sampling distribution

第二十二章曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.

顺序表的删除.

模型分类问题 Presented by 刘婷婷苏琬琳.

概率统计主讲教师叶宏山东大学数学院.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

作业 P152 习题复习：P 预习：P /5/2.

实体描述呈现方法的研究实验评估 2019/5/1.

电影海报设计 ——巧用“分层云彩”滤镜.

复习：若A(x1,y1,z1) , B(x2,y2,z2), 则 AB = OB - OA=(x2-x1 , y2-y1 , z2-z1)

第16讲相似矩阵与方阵的对角化主要内容： 1.相似矩阵 2. 方阵的对角化.

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

3．1．2 空间向量的数量积运算 1．了解空间向量夹角的概念及表示方法． 2．掌握空间向量数量积的计算方法及应用．

数据集的抽取式摘要程龚, 徐丹云.

概率统计主讲教师叶宏山东大学数学院.

第三章　函数的微分学第二节　导数的四则运算法则一、导数的四则运算二、偏导数的求法.

第4课时绝对值.

多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer

学习任务三偏导数结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

第七、八次实验要求.

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

2019/5/21 实验一离散傅立叶变换的性质及应用实验报告上传到“作业提交”。 11:21:44.

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

正弦、余弦函数的性质华容一中伍立华 2017年2月24日.

§2 方阵的特征值与特征向量.

2.3.运用公式法 1 —平方差公式.

图片与视频数字化. 图片与视频数字化图片分类根据图片的构成元素来分位图：由像素组成，计算机按顺序存储每个像素点的颜色信息的保存方式获得的图片。位图放大后会模糊失真，存储空间相对较大。矢量图：由图元组成，通过数学公式计算获得的图片。放大后不会失真，占用空间小。

回归分析实验课程（实验三）多项式回归和定性变量的处理.

基于列存储的RDF数据管理朱敏

定义5 把矩阵 A 的行换成同序数的列得到的矩阵,

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

本底对汞原子第一激发能测量的影响钱振宇

第三节数量积向量积混合积一、向量的数量积二、向量的向量积三、向量的混合积四、小结思考题.

§4.5 最大公因式的矩阵求法（ Ⅱ ）.

§2 自由代数定义19.7:设X是集合，G是一个T-代数，为X到G的函数,若对每个T-代数A和X到A的函数，都存在唯一的G到A的同态映射,使得=，则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变， 变 变， 也变对给定的 和A，是唯一的.

9.3多项式乘多项式.

Presentation transcript:

关于自底向上的显著性方法的综述报告人：周静波 2012年08月30日

报告提纲研究现状算法模型介绍实验结果及分析结论

研究现状

研究现状基于视觉注意的显著性区域检测对于图像分析过程有着非常重要的意义。注意是人类信息加工过程中的一项重要的心理调节机制，它能够对有限的信息加工资源进行分配，使感知具备选择能力。如果能够将这种机制引入图像分析领域，将计算资源优先分配给那些容易引起观察者注意的区域，这样必将极大的提高现有的图像处理分析方法的工作效率。显著性区域检测正是在这个基础上提出并发展起来的。

研究现状显著性检测一般分为两类自下而上基于数据驱动的显著性区域突现自上而下任务驱动的目标突现本报告只关注自下而上的显著性检测算法

研究现状 Achanta 将这些算法分成三类基于低层视觉特征，代表性算法是文献[1]中提出的模拟生物体视觉注意机制的选择性注意算法(Itti 算法) 没有基于任何生物视觉原理的纯数学计算方法，如Achanta 等[4] 提出的全分辨率算法(AC 算法) 和Hou 等[5] 提出的基于空间频域分析的剩余谱算法(Spectralresidual approach, SR) 将前两种进行融合的方法，代表性算法是Harel 等[6] 提出的基于图论的算法(Graph-based visual saliency，GBVS)

研究现状 Goferman将显著性分析算法分成以下三类考虑局部特征的，如Itti 算法和GBVS 算法考虑整体性的，如SR 算法和Achanta 等[3] 提出的算法(IG 算法) 局部与整体结合的，如Goferman等[7]和Liu 等提出的算法

算法模型介绍

Itti模型 Itti 模型中, 显著值是像素点在颜色、亮度、方向方面与周边背景的对比值。该模型包括两个步骤: 特征提取显著图生成

AIM模型 AIM（Attention-based on Information Maximization）模型利用香农的自信息度量，将图像的特征平面变换到对应于视觉显著性的维度上。 AIM假设：一个视觉特征的显著性就是该特征相对于它周围其他特征提供的信息的差别度。根据香农定理，图像特征对应的自信息通过下面的公式进行计算为特征的概率密度函数。

GBVS模型 GBVS（Graph-Based Visual Saliency）模型是在Itti的模型基础之上运用马尔可夫随机场的特点构建二维图像的马尔可夫链，通过求其平衡分布而得到显著图算法步骤：特征的提取：与Itti 算法类似显著图生成：马尔可夫链方法

FTS模型 FTS（Frequency-Tuned Saliency）模型是由Achanta等人提出的一种自底向上的显著性检测方法，通过局部颜色和亮度特征的对比多尺度方法求像素点显著值。将原始图像由SRGB颜色空间转化成CIE颜色空间，然后显著性映射定义为其中为图像特征的几何平均向量，为对原始图像的高斯模糊，采用的二项式核。为范数，为像素点坐标。

SR模型 SR（Spectral Residual）模型是由Hou等人提出来的，基于空间频域分析的算法之一，显著图通过对剩余谱做傅里叶逆变换得到。剩余谱定义为其中，为原图二维傅里叶变换得到的频域空间，为局部平均滤波器（一般n取3）

PQFT模型 PQFT（Phase Spectrum of Quaternion Fourier Transform）模型是由Guo等人在Spectral Residual基础之上提出的，该方法通过计算图像的四元傅里叶变换的相位谱得到图像的时空显著性映射。事实上，图像的相位谱即图像中的显著性目标。图像中的每一个像素点都用四元组表示：颜色，亮度和运动向量。 PQFT模型独立于先验信息，不需要参数，计算高效，适合于实时显著性检测

PQFT模型假设表示时间t时刻的输入图像，，为所有图像帧的总数。分为红、绿、蓝三个颜色通道，表示为，那么，可以将三个颜色通道扩展为四个广义的颜色通道：

PQFT模型类似于人类视觉系统，对立颜色通道定义为亮度通道和运动通道定义为其中为使用者设定的延迟因子。

PQFT模型四元组图像可以表示为下列形式其中，满足，可以写成如下形式

PQFT模型将图像中每一个像素点表示为，为空间坐标，为时间坐标。四元傅里叶图像变化写成将图像中每一个像素点表示为，为空间坐标，为时间坐标。四元傅里叶图像变化写成表示频域坐标，表示图像维度。四元逆傅里叶变化为

PQFT模型可将表示为的极坐标形式其中为的相位谱。设定，则只剩下相位信息。计算逆相位信息可得到时空显著性映射为可将表示为的极坐标形式其中为的相位谱。设定，则只剩下相位信息。计算逆相位信息可得到时空显著性映射为其中g表示二维高斯平滑滤波。当输入为静态图像时，。

SDSR模型 SDSR（Saliency Detection by Self-Resemblance）模型由Seo等人提出的，通过计算感兴趣像素点的特征矩阵与其相邻的像素点的特征矩阵之间的相似性，来确定像素点的显著性映射。每一个像素点的局部图像结构表示成一个局部描述子（局部回归核）矩阵；然后，利用矩阵余弦相似计算量化每一个像素点和它相邻的像素点对应的局部描述子矩阵之间的相似性。

SDSR模型对于像素点i，与之对应的特征矩阵，给定像素点i周围相邻的像素点特征矩阵，显著性映射为其中为矩阵和的余弦相似性，为局部权重参数。局部特征矩阵的列表示局部指导核的输出

SDSR模型

SUN模型 SUN（Saliency Using Natural Statistics）模型由Zhang等人提出的，模仿视觉系统检测潜在的目标。假设z代表视觉区域中的一个点。二值随机变量C代表该点是否属于目标，L表示该点的坐标位置，F表示该点的视觉特征。定义为，分别表示点z的特征和坐标。根据贝叶斯定理

SUN模型假设特征和坐标相互独立，那么对上式两边同时取对数，由于对数函数是单调增加的，因此不会影响各点的显著值排列

SUN模型只依赖于点z的视觉特征，独立于任何先验信息。在信息论中，该项实际上求随机变量F取值为时的自信息。体现了目标的先验信息。比如，当知道目标物体为绿色时，那么该项的值在遇到绿色点时比遇到蓝色点要大。独立于视觉特征，反映了目标物体位置的先验信息。一般情况下，我们并不知道目标的位置信息和目标的视觉特征，于是我们省略后两项，只剩下自信息这一项

GCS模型 GCS（Global Contrast based Saliency）模型是由程明明等人基于输入图像的颜色统计特征提出的基于直方图对比度的图像显著性值检测方法。具体的说，一个像素的显著性值用它和图像中其他像素颜色的对比度来定义。图像中像素点的显著性定义为其中为像素在Lab空间的颜色距离度量。如果忽略空间关系，使得具有相同颜色的像素归到一起，得到每一个颜色的显著性值

GCS模型为了加入空间关系，首先利用基于图的图像分割方法将输入图像分割成若干个区域。然后对每一个区域建立颜色直方图。对每一个区域，通过测量它与图像其他区域的颜色对比度来计算它的显著值为区域的权值，为两个区域的颜色距离度量。对于区域和，他们之间的颜色距离度量定义为为第i个颜色在第k个区域的所有种颜色中出现的概率。

GCS模型为了增加区域的空间影响效果，基于空间加权区域对比度的显著性定义为：为区域和的空间距离，控制空间权值强度。

PBS模型 PBS（Patch-based Saliency）模型都是先将图像分割为一系列大小一致的图像块，再根据不同的特征提取方式，对图像块进行特征提取。下面介绍PBS算法的一般步骤对于维数为的图像，将其分解为一系列大小为的图像片。为简便起见，我们不考虑图像片的重叠问题。图像片的总数为。对于任一图像片，将其表示成向量形式，最终得到一个表示图像片的矩阵

PBS模型使用PCA抽取特征。对图像片矩阵，计算对应的协方差矩阵为：对A进行特征值分解，选择前d个最大特征值对应的特征向量。其中U的维度为。

PBS模型给定图像片和，它们之间的不一致性为：其中，为绝对值函数。

PBS模型图像片的显著性计算方法为：其中为图像片总数。

实验结果与分析

实验结果与分析我们在Achanta等人提供的公开测试数据集上面测试了上述所有方法。据我们所知，此数据集是此类数据最大的测试集，并且有人工精确标注了显著性区域。将所有方法都在1000张图片上进行计算得到显著图。

实验结果与分析

实验结果与分析

实验结果与分析

实验结果与分析根据不同模型中提到的方法对显著图进行二值化，并且与实际分割图进行比较，得到查准率(precision)和查全率(recall)以及F三个指标值。其中，我们设置，得到的查准率(precision)和查全率(recall)以及F指标如表1所示

实验结果与分析算法/指标 precision recall F-measure Itti 0.62 0.23 0.45 AIM 0.81 0.64 0.76 GBVS 0.84 0.63 0.78 FTS 0.88 0.77 0.85 SR 0.71 0.28 0.52 PQFT 0.75 0.33 0.58 SDSR 0.83 0.8 SUN 0.72 GCS（RC） 0.9 PBS 0.86

结束语

结束语从上述10类自底向上的显著性检测模型中，所有算法都容易受到背景中噪声的影响。这是因为，自底向上的算法采用的特征都是一些底层的特征，如颜色，亮度，方向和空间位置信息。在未来工作中，我们希望能够研究包含空间关系且保留详细细节的全局显著性图像的高效计算算法，并且希望研究能够处理具有复杂纹理背景图像的检测算法另外，我们还希望在显著性检测过程中增加一些特征，比如人脸，对称性等，进一步增加检测算法的鲁棒性.

谢谢！报告人：姓名 2009年XX月XX日