9.4 基于纹理的深度图重建.

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
《解析几何》 -Chapter 3 §7 空间两直线的相关位置.
3.4 空间直线的方程.
Ensite系统指导下复杂心律失常的射频消融治疗
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
不确定度的传递与合成 间接测量结果不确定度的评估
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
Survey of Background Blurring
Introduction To Mean Shift
Applications of Digital Signal Processing
NLP Group, Dept. of CS&T, Tsinghua University
§3.7 热力学基本方程及麦克斯韦关系式 热力学状态函数 H, A, G 组合辅助函数 U, H → 能量计算
Seam Carving for Content-Aware Image Resizing
第十章 基于立体视觉的深度估计.
Shape(Structure) From X
光流法 (Optical Flow) 第八章 基于运动视觉的稠密估计 光流法 (Optical Flow)
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
9.4 基于纹理的深度图重建.
基于全方位视觉的多人体运动检测跟踪 利用全方位摄像机获取360˚ 的环境信息,在室内对多个人体目标进行实时运动检测。
Cyclic Hanoi问题 李凯旭.
动态规划(Dynamic Programming)
A Study on the Next Generation Automatic Speech Recognition -- Phase 2
工业机器人技术基础及应用 主讲人:顾老师
第8章 静电场 图为1930年E.O.劳伦斯制成的世界上第一台回旋加速器.
工业机器人技术基础及应用 主讲人:顾老师
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
VIDEO COMPRESSION & MPEG
高性能计算与天文技术联合实验室 智能与计算学部 天津大学
基于EM的MRF彩色图像分割 李求旭.
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
作业 P152 习题 复习:P 预习:P /5/2.
第九章 明暗分析 Shape from Shading SFS SFM SFC SFT …… SFX.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
以四元樹為基礎抽取圖片物件特徵 之 影像檢索
在運動過程中,粒子在每一特定時間對應一特定位置:位置是時間的函數!
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
静定结构位移计算 ——应用 主讲教师:戴萍.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
难点:连续变量函数分布与二维连续变量分布
滤波减速器的体积优化 仵凡 Advanced Design Group.
基于列存储的RDF数据管理 朱敏
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
Principle and application of optical information technology
之前都是分类的蒸馏很简单。然后从分类到分割也是一样,下一篇是检测的蒸馏
Rlj
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

9.4 基于纹理的深度图重建

包含多个纹理区域的图像

flower beeren 彩色纹理图像 water food

1 纹理(Texture) 目前对于纹理的精确定义还未形成统一认识,多根据应用需要做出不同定义. 两种较常采用的定义: 定义1 按一定规则对元素(elements)或基元(primitives)进行排列所形成的重复模式. 定义2 如果图像函数的一组局部属性是恒定的,或者是缓变的,或者是近似周期性的,则图像中的对应区域具有恒定的纹理.

纹理(Texture) 纹理的基本特征 纹理是区域属性,并且与图像分辨率(或称尺度,resolution or scale)密切相关 重复性 规则性 周期性 方向性

空域滤波 局部模板法 局部矩法 设计一组具有频率选择性的模板,与图像做卷积. 以每一个像素为中心,计算局部窗口内的矩特征值,形成特征图像. 相当于用一组模板对图像进行滤波.

空域滤波 The filter bank used in texture analysis. Total of 48 filters: 36 oriented filters, with 6 orientations, 3 scales, and 2 phases, 8 center-surround derivative filters and 4 low-pass Gaussian filters.

Gabor变换与小波变换 Gabor变换(高斯窗口) (D. Gabor, 1946) 小波变换: 窗口宽度随频率变化而变化

Gabor变换纹理特征 二维Gabor滤波器具有频率和方向选择性 Gabor纹理特征提取的一般步骤: 2. 对各个子图像做一定处理; 3. 根据子图像计算相应特征,形成特征矢量或特征图像,比如子图像窗口内的标准差.

Gabor变换纹理特征示例: (a) 纹理图像 (b) 滤波图像 (16,135度) (c) 滤波图像 (32,0度) (d) 特征图像(b) (e) 特征图像(c)

小波变换纹理特征 对图像作小波变换, 分别得到水平和垂直方向上的高频和低频子图像,可以对低频子图像或每个子图像再作同样的变换. 根据最后得到的每个子图像计算一个特征,如能量,墒等,形成纹理特征矢量.

Markov随机场 图像建模的重要工具,应用广泛. 预备知识(标注问题,labeling) (J. Besag, 1974) 位(site)集合: 标志(label)集合,位上可能发生事件的集合,可以是连续的,也可以是离散的: ,

Markov随机场 标注:为位集合中每个位指定一个标志的过程,位集合到标志集合的映射:

Markov随机场 标注:从如下 空间中导出 的过程: 标注:从如下 空间中导出 的过程: 在图象领域,可将 理解为一幅图象, 则是全部可允许图像的集合. 标注也被称为着色(coloring,数学规划)或配置(configuration,随机场) 如果各个位为随机变量,则位集合 称为随机场.

Markov随机场 在随机场中,从 导出 的过程就是确定 出现的概率. 假设各个位的标注是彼此无关的,则有 , 在随机场中,从 导出 的过程就是确定 出现的概率. 假设各个位的标注是彼此无关的,则有 , 只需单独考虑每个位,问题简单(理想) 实际应用时,需要考虑上下文约束 (contextual constraints) Markov随机场

Markov随机场 当且仅当以下两个条件满足时,随机场为Markov随机场: 若fi能够独立发生,那么f就能够发生 正性(Positivity) Markov性(Markovianity) 若fi能够独立发生,那么f就能够发生 一个像素点的随机概率只与它邻域的像素有关

根据矩阵中各位置与位置i的距离,可以将邻域系统表达为等级形式 邻域系统的等级划分 一个象素点和图像中其他各象素点的相关性就可以通过条件概率和邻域系统来描述

Gibbs随机场 邻域系统(neighboring system) 邻域集 (neighbor set): 一阶邻域(四连通),二阶邻域(八连通)等 团(cliques): 由邻域关系限定的位子集 单位团(single-site) ,双位团(pair-site) ,三位团(triple-site)等 团是有序的:

Gibbs随机场 邻域 团 团具有尺寸, 形状和方向

Gibbs随机场 当且仅当随机场的配置服从Gibbs分布时,称为Gibbs随机场: :温度常量,常取1 规范化常量,称为划分函数(partition function) 所有团势能之和,称为能量函数(energy function) :团势能(clique potential)

Gibbs随机场 物理意义 均匀性 (homogeneity): 配置的能量越小,其概率越大 各向同性(isotropic): 有均匀性 与团在随机场中的位置无关 或者说, 与位i无关 各向同性(isotropic): 与团的方向无关 在纹理领域,Markov(Gibbs)随机场具 有均匀性

Gibbs随机场 Hammersley-Clifford定理 意义: Markov随机场与Gibbs随机场等价 意义: 既可以用局部成分的相互影响来建模,也可以用全局能量来建模. 如何确定团势能的形式和参数是Markov(Gibbs)随机场的主要工作. 划分函数的计算复杂度很高,是一个难题,实际多做一定简化.

3 从纹理恢复形状 根据纹理属性变化与表面形状的关系恢复表面形状. 三种效应: 基准维(characteristic dimension): 透视缩小(与表面方向有关) 缩放和密度变化(与观察者 和纹理基元的距离有关) 基准维(characteristic dimension): 没有发生透视缩小的方向

3. 从纹理恢复形状 几种方法 Bajcsy-Lieberman方法:利用基元尺寸梯度,求相对深度; Witken方法:利用边缘方向分布,估计表面方向; Blostein-Ahuja方法:利用基元面积梯度,估计表面方向.

椭圆长短轴在缩小(缩放效应) 缩小速度长轴为线性,短轴为二次(透视缩小效应,长轴方向为基准维)

Blostein-Ahuja方法 假设表面为平面,纹理基元单一且无深度差 恢复公式(依据)的推导 1. 为简化推导,将坐标系统转换到tilt方向 2. 根据透视投影模型,建立任意基元长短轴与中心基元长短轴的长度关系; 3. 将上述关系转化为任意基元与中心基元的面积关系.

坐标系统变换

透视投影模型

Blostein-Ahuja方法 形成表面方向估计依据 → 为未知参数空间,根据纹理图像从中搜索最佳结果: 将该空间离散化,对于每组值,计算图像中各个位置上的纹理基元面积,与实际面积比较,获得拟合度,取最佳拟合度对应的结果. (表面拟合)

Blostein-Ahuja方法结果示例

4.基于纹理变化的深度估计算法 SFT的传统方法是通过建立一个随机场模型描述图像中纹理信息,通过学习得到模型参数,实现场景深度重建,但由于此类方法使用的是局部的、二维纹理信息,因此所建立的模型中无法完全反映出场景中各目标间的空间关系。近几年来,针对此类问题的研究逐渐向使用全局的、多尺度的、分层次的纹理信息方向发展,并已经开始应用于实际系统中。 2006年,斯坦福大学的Andrew Ng等人应用机器学习的方法,采用分层的多尺度马尔科夫随机场模型,通过对大量的训练集数据的学习,建立室外场景图像中各目标间的空间关系模型,并将取得的结果应用在无人汽车的自主导航中。 这种利用全局的三维几何纹理信息的方法,实际上就是在利用了图像“质地变化率”的同时也利用了图像中的遮挡信息(空间关系)。 3-D Depth Reconstruction from a Single Still Image Ashutosh Saxena, Sung H. Chung, Andrew Y. Ng ,2007

4.1 Visual Cues for Depth Perception Monocular Cues texture variations, texture gradients, interposition, occlusion, known object sizes, light and shading, haze, defocus, etc. global information, local information. Stereo Cues Motion Parallax and Focus Cues

4.2 Feature Vector The image is divided into small rectangular patches, and estimate a single depth value for each patch. Two types of features: absolute depth features—used to estimate the absolute depth at a particular patch—and relative features, used to estimate relative depths.

Feature Vector three types of local cues: texture variations, texture gradients, color. Capture cues Laws’ masks(3*3)------- texture variations Oriented edge filters(6)------- texture variations Color channel(2)------- color

2.1 Features for absolute depth

Features for absolute depth initial feature vector---sum absolute energy and sum squared energy, multiple spatial scales---capture more global properties of the image, immediate neighbors---capture occlusion relationships, vertically column---show vertical structure. absolute depth feature vector x is 19 ∗ 34 = 646 dimensional.

2.2 Features for relative depth A different feature vector is used to learn the dependencies between two neighboring patches. a 10-bin histogram of each of the 17 filter outputs |I ∗Fn|, giving us a total of 170 features yis for each patch i at scale s. relative depth features yijs for two neighboring patches i and j at scale s will be the differences between their histograms.

4.3 Probabilistic Model Hierarchical Multi-scale MRF Model

Probabilistic Model Gaussian Model Laplacian model

Gaussian Model di(s) depths for multiple scales s = 1, 2, 3. enforce a hard constraint that depths at a higher scale are the average of the depths at the lower scale. Ns(i) are the 4 neighbors of patch i at scale s. M is the total number of patches in the image (at the lowest scale); Z is the normalization constant for the model; xi is the absolute depth feature vector for patch i; and θ and σ are parameters of the model.

Gaussian Model (θr,σ1r,σ2r) is the different parameters for each row r in the image The model is a conditionally trained MRF, in that its model of the depths d is always conditioned on the imagefeatures X; i.e., it models only P(d|X).

Laplacian model

Experiments Data collection, using a 3-d laser scanner to collect images and their corresponding depthmaps

Experiments

Experiments original image, (b) ground truth depthmap, (c)predicted depthmap by Gaussian model, (d) predicted depthmap by Laplacian model.