Lecture 12 Object Recognition

Slides:



Advertisements
Similar presentations
办公室保健指南. 减少辐射篇 ❤显示器散发出的辐射多数不是来自它的正面,而是侧面和后面。因此,不要 把自己显示器的后面对着同事的后脑或者身体的侧面。 ❤常喝绿茶。茶叶中含有的茶多酚等活性物质,有助吸收放射性物质。 ❤尽量使用液晶显示器。
Advertisements

第十八章 判别分析 Discriminant Analysis. Content Fisher discriminant analysis Maximum likelihood method Bayes formula discriminant analysis Bayes discriminant.
2016年9月8日 2016年9月8日 2016年9月8日 1 Semi-supervised Learning by Sparse Representation Shuicheng Yan Huan Wang Lecturer: Yitao Zhai.
一、真愛密碼 二、尋求真愛 三、有自尊的愛. 。如果雙方對愛情產生 質疑、困惑時,則表示 彼此之間的愛情關係仍 有 待加強或釐清,千萬別 急著為自己的人生大事 下決定。 我是一個 16 歲的未婚媽媽,發現自 己懷孕時,已經五個月大了,我知 道自己沒能力照顧孩子,在驚訝之 於,大人們只好坦然接受,幫我找.
大地遊戲王 課程實錄.
Some theoretical notes on boosting
加強水銀體溫計稽查管制及回收 回收作業須知及緊急應變措施
第4章 分錄及日記簿 4-1 借貸法則 4-2 日記簿的格式及記錄方法 4-3 分錄的意義及記錄方法 4-4 常見分錄題型分析
會計資訊系統 專章A.
第三章 調整與編表.
我在哈佛、麥肯錫 學到的一流工作術 富坂美織◎著.
第十三屆 Step.1 我們的目標 Step.2 我們的角色 Step.4 權利與義務 義務 權利 年繳會費五百元整
Bagging & Boosting.
第五讲 国家公务员制度 主要内容: 一、当代中国公务员制度的建立、发展 二、中国公务员制度建设的内涵与特色 三、中西公务员制度改革比较
資料探勘(Data Mining)及其應用之介紹
植物保护 课程整体设计 汇报 申报省级精品资源共享课建设 植物保护课程组.
第七章 紋理描述與分類.
提纲 前期调研 AdaBoost原理 一些问题.
政府扶持资金通览 技术改造篇.
Boosting原理及在分类上的应用 电子工程系 刘辉 2002 年 12 月 9 日.
Facial Point Detection using Boosted Regression and Graph Models
Multi-Cue Onboard Pedestrian Detection
文本分类综述 王 斌 中国科学院计算技术研究所 2002年12月.
物体识别 3D建图 semantic mapping
基于全方位视觉的多人体运动检测跟踪 利用全方位摄像机获取360˚ 的环境信息,在室内对多个人体目标进行实时运动检测。
Ch 06.特征降维和选择 Part 1 特征降维 1.
第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库 数据库中数据的组织由低到高分为四级:字段、记录、表、数据库四种。
Introduction to AI and ML
Online job scheduling in Distributed Machine Learning Clusters
Ch 08.多层神经网络 1.
第十章 方差分析.
数据挖掘工具性能比较.
动态规划(Dynamic Programming)
基于规则抽取的 时间表达式识别.
整合思维导图的初中英语教学设计 主讲人:卢璐.
核函数方法及其在过程控制中的应用研究 Studies on the kernel-based methods
最大熵模型简介 A Simple Introduction to the Maximum Entropy Models
WSDM见闻 程龚.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
Chapter 8 Model Inference and Averaging
贈與契約.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
集成网络概述 刘雪飞.
模型分类问题 Presented by 刘婷婷 苏琬琳.
基于信息融合的面部表情分析与识别 研 究 生:刘 松 指导老师:应自炉 学科专业:信号与信息处理.
网页设计与制作 —— 学习情境二:网页模板设计
兒少保護通報處理流程介紹 臺中市家庭暴力及性侵害防治中心 陳秀婷/張美慧 社工督導員 2012/10/19.
聚类 IRLAB.
第4章 Excel电子表格制作软件 4.4 函数(一).
Chapter 18 使用GRASP的对象设计示例.
序言 報告內容: 你對父母的感覺 你與父母的關係 你是否與父母同居 你與父母見面的時間 每天與父母的談話時間 與父母談話的內容 結論 感想.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第七、八次实验要求.
基于最大margin的决策树归纳 李 宁.
蔡世民 合作者:禚钊,傅忠谦,张捷 电子科学与技术系 中国科学技术大学 2011/4/29
§2 方阵的特征值与特征向量.
第六章 Excel的应用 五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行
滤波减速器的体积优化 仵凡 Advanced Design Group.
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
Continuous Authentication for Voice Assistants
Chapter 7 Dimensionality reduction Prof. Dehan Luo
第十七讲 密码执行(1).
第十二讲 密码执行(上).
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
第四章 買賣業會計.
語音特徵擷取之 資料相關線性特徵轉換 研究生:張志豪 多酌墨在數學式的物理意義及精神。 老師、各位口試委員、各位同學大家好。
质量控制(QC)模式 BrookFIELD.
《神经网络与深度学习》 第10章 模型独立的学习方式
统计学习理论和SVM(支持向量机).
Presentation transcript:

Lecture 12 Object Recognition 第十二章 目标识别 Lecture 12 Object Recognition

目标识别 怎样识别图像中物体,如汽车、牛等?

目标识别的应用

难点之一: 如何鲁棒识别?

类内差异(intra-class variability)

类间相似性(inter-class similarity)

难点之二:计算量大 一幅图像中像素个数多,目前每秒约产生30G像素的 图像/视频数据。 - Google图片搜索中已有几十亿幅图像 - 全球数字照相机一年产生180亿张以上的图片(2004 年) - 全球一年销售约3亿部照相手机(2005) 人的物体识别能力是强大的 - 灵长类动物约使用大脑皮层的一半来处理视觉信息 [Felleman and van Essen 1991] - 可以识别3,000-30,000种物体 - 物体姿态可允许30度以上的自由度。

难点之三:如何在小样本条件下学习

物体识别方法 检测(detection)vs. 不检测 表示(representation) - 颜色、纹理、边缘、梯度、局部特征、深度、运 动等等。 分类(classification or categorization) - K近邻(KNN) - 神经网络(NN) - 支持向量机(SVM) - Boosting(Adaboost等) - 隐马尔科夫模型(HMM) -其他 生成学习(Generative learning)vs. 判别学习 (discriminative learning)

两种分类器学习模式 生成学习 vs. 判别学习 生成学习 ---目标是学习到符合训练数据的类别模型 判别学习 --- 如EM算法(Maximum Likelihood) 判别学习 在训练阶段即考虑类别之间的判别信息 包括Support Vector Machines (SVMs), Boosting, Minimum Classification Error (MCE), Maximum Mutual Information (MMI), Lager Margin (LM), and etc. 判别学习算法比生成学习算法表现出更好的分类性能。

判别学习方法

人脸检测与识别

Car/non-car Classifier 1. 物体检测 基于二分类器 Car/non-car Classifier Yes, car. No, not a car.

Car/non-car Classifier 物体检测 在复杂背景下,通过滑动窗口(sliding windows)搜索感兴趣的物体。 Car/non-car Classifier

物体检测 Step1. 获取训练数据 Step2. 提取特征 Step3. 训练分类器 Step4. 利用分类器进行检测

人脸检测(Face detection) Viola-Jones人脸检测算法(基于AdaBoost)

Viola-Jones人脸检测算法(2004)

滤波器设计

Adaboost Adaboost是一种迭代算法,其核心思想是针对同一个训 练集训练不同的分类器(弱分类器),然后把这些弱分类 器集合起来,构成一个更强的最终分类器(强分类器)。 其算法本身是通过改变数据分布来实现的,它根据每 次训练集之中每个样本的分类是否正确,以及上次的 总体分类的准确率,来确定每个样本的权值。将修改 过权值的新数据集送给下层分类器进行训练,最后将 每次训练得到的分类器最后融合起来,作为最后的决 策分类器。 使用adaboost分类器可以排除一些不必要的训练数据特 徵,并将关键放在关键的训练数据上面。

Boosting Example

Boosting Example

Boosting Example

Boosting Example

Boosting Example

Boosting Example

Adaboost 学习目标:选择能够最有效地区分人脸与非人脸的矩形特征及其阈值

Adaboost 组合弱分类器(weak learners),得到更为精确的集成分类器(ensemble classifier)。 弱分类器:性能仅比随机分类稍好 根据矩形特征定义弱分类器:

Adaboost算法步骤 初始给每个训练样本以同等权重 循环执行以下步骤: 根据当前加权训练集,选择最佳弱分类器 提升被当前弱分类器错分的训练样本的权重 按照各弱分类器分类精度对其加权,然后将各个弱分类器形成线性组合,得到最终分类器。

Viola-Jones算法中的AdaBoost 每一次boosting迭代如下: 评价每一个样本上的每一种矩形特征 为每一种矩形特征选择最佳分类阈值 选择最优的矩形特征及其阈值组合 改变样本权重 计算复杂度: O(MNT) M:特征数,N:样本数, T:阈值数

级联分类器(Cascading Classifiers)

训练级联分类器

Viola-Jones检测算法-总体流程 用5K正样本,350M反样本学习 得到38层(共使用6060个特征)级联分类获得实时性

Viola-Jones人脸检测结果

Viola-Jones人脸检测结果

Viola-Jones人脸检测结果

2. 人脸识别(face recogntion) Zhao et al., Face Recogniton: a literature survey. ACM Computing survey, 2003

Face Recognition: 2-D and 3-D

图像 = 像素的集合 将由n个像素构成的图像视为n维空间中的点

最近邻分类器

Eigenfaces 使用主成分分析技术(Principle Component Analysis, PCA)减少维数

主成分分析(PCA, K-L变换) 降低特征向量的维数 获得最主要特征分量,减少相关性; 避免维数灾难

主成分分析(PCA, K-L变换)

主成分分析(PCA, K-L变换)

Eigenfaces 学习 1. 计算训练图像的均值和协方差矩阵. 2. 计算协方差矩阵的特征值,取前k个最大特 征值对应的特征矢量. 3. 将图像投影到k-维特征空间 (Eigenspace)。 识别 1. 将测试图像投影到Eigenspace. 2. 在特征图像上执行分类.

Eigenfaces: 训练图像

Eigenfaces

PCA方法的不足 可能损失重要的细节信息 方差最小的方向也可能是重要的 没有考虑判别任务 希望得到最具判别能力的特征 但判别能力最佳并不等同于方差最大

Fisherfaces:类特定的线性投影

PCA & Fisher的线性判别函数

PCA & Fisher的线性判别函数

Fisherfaces示例(ORL Database)

基于eigenfaces/fisherfaces的识别 训练: - 根据训练图像,利用PCA或Fisher方法确定投 影矩阵 - 将每个训练图像投影到子空间(eigenspace或fisherspace)。 识别: - 将测试图像投影到eigenspace或fisherspace。 - 子空间中距离测试图像最近的训练图像对应的类别为识别结果。

Project5:人脸合成 平均 就是 美 平均 人脸

Project5:人脸合成

Project5:人脸合成

Project5:人脸合成

Project5:人脸合成

Project5:人脸合成 FantaMorph,人脸合成软件

Project5:人脸合成 FantaMorph,人脸合成软件 手动标定人脸

Project5:人脸合成 FantaMorph,人脸合成软件 手动标定人脸

Project5:人脸合成 FantaMorph,人脸合成软件 产生多张合成图像,随机或者平均输出

Project5:人脸合成 Task:利用人脸检测算法,将上述过程改为自动完成,实现自动人类合成。