计算机视觉 Computer Vision 北京理工大学 计算机科学与工程系 2006年3月9日 Computer Vision

Slides:



Advertisements
Similar presentations
1. 甚麼是人工智能 ? 甚麼是人工智能 ? 2. 強人工智能 - 弱人工智能 強人工智能 - 弱人工智能 3. 實現人工智能的必要條件 實現人工智能的必要條件 4. 人工智能的例子 人工智能的例子 5. 虛擬真實 虛擬真實 6. 感想 感想.
Advertisements

1 第一章:绪论 什么是信源编码? 为什么要信源编码 / 数据压缩? 为什么可以信源编码 / 数据压缩? 怎样进行信源编码?
Chapter 5 教育發展與職業選擇. 1. 認識高職學生的生涯進路。 2. 了解個人特質與職業屬性之 間的關係。 3. 認識打工安全與勞動權益。
2010 新聞局影視幕後人才培訓課程 電視節目的類型解析 講師:高光德教授. 電視節目主要類型  新聞氣象節目  體育節目  綜合娛樂節目.
報告書名:父母會傷人 班級:二技幼四甲 姓名:吳婉如 學號:1A2I0034 指導老師:高家斌
小 王 子 組別:第五組 班級:財金二甲 組員:A 林安潔 A 陳思羽 A 許雅涵
提纲 主要参考书目 AI的基础及萌芽 AI的创立及发展 AI的主要研究范围 国外著名的AI研究机构 AI在中国 AI的最新动态
95年度工程教育認證 淡江大學資訊工程學系 整體概況簡報
11-1 保險業之定義 11-2 保險業之設立 11-3 保險業之組織 11-4 保險業之營業範圍
计算机图形学 Computer Graphics
9-1 火災保險 9-2 海上保險 9-3 陸空保險 9-4 責任保險 9-5 保證保險 9-6 其他財產保險
媽,我們真的不一樣 青少年期與中年期 老師: 趙品淳老師 組員: 胡珮玟4A1I0006 馬菀謙4A1I0040
王晨 指导教师:张军平副教授 复旦大学计算机科学技术学院 上海市智能信息处理重点实验室
槍砲病菌與鋼鐵 第三組.
教材: 王万良《人工智能及其应用》(第2版) 高等教育出版社,
亚洲国家一流大学建设的国际化道路: 体制改革的视角
課程:諮商概論 指導老師:李秀玉老師 閱讀書籍:傷癒—低估自我的醫治(一) (P.60~69)
汇报人:李臻 中国海洋大学信息科学与工程学院 计算机科学与技术系
班級:二幼三甲 姓名:郭小瑄 、 詹淑評 學號:1A2I0029 、1A2I0025
導覽解說與環境教育 CHAPTER 3 解說員.
財務報表的內容 四種報表格式 財務報表的補充說明 會計師簽證的重要性 合併報表 財務報表分析 Chapter 2 財務報表的內容.
老師 製作 法律與生活.
指導老師:陳韻如 姓名:吳宜珊 學號:4A0I0911 班級:幼保二乙
第十七章休閒農業之經營策略與成功之道 17 Chapter.
Chapter 2 勞工安全衛生法.
烏龍派出所 704陳巧茹.
傳統童玩遊戲創新 組別:第八組 班級:幼保二甲 組員: 4A0I0005柯舒涵 4A0I0011謝孟真
做最好的自己 ——七(6)班主题班会.
时代发展趋势: 科学人文交融 华中科技大学 杨叔子 2010年2月修改.
第 1 章 資訊新未來.
CHAPTER 5 現值法 工程經濟學 Chapter 5 現值法. CHAPTER 5 現值法 工程經濟學 Chapter 5 現值法.
風險分析與財務結構 瞭解風險的定義與種類 衡量企業風險與財務風險 影響企業風險的因素 影響財務風險的因素 以現金流量衡量企業長期的財務狀況
國際行銷管理 林 建 煌 著.
作业效率分析 1. Performance 概念 2. PAC 3. 作业效率改善方案.
计算机视觉 Computer Vision 艾海舟 2011年3月 Sept.17, 2010.
第一節 知覺 第二節 認知 第三節 學習 第四節 創造力
做一个清醒、睿智、稳健、        有为的领导者 军队管理教研室 蒋少散.
汇报人:王晓东 单 位:信息科学与工程学院 日 期:2016年9月
CHAPTER 2 綜合所得稅之架構.
計算方法設計與分析 Design and Analysis of Algorithms 唐傳義
研究、論文、計畫與生活之平衡 演講人:謝君偉 元智大學電機系 2018年11月22日.
Digital Image Processing
Introduction to Computer Graphics
作者 :Pawan Sinha, Benjamin Balas, Yuri Ostrovsky, Richard Russell
Digital System Lab Experiment 7 解碼器與七段顯示器.
AOI (Automatic Optical Inspection )
射影幾何於攝影測量上之應用 Projective Geometry in Photogrammetry
理論.
LOM-領隊導向多人連線遊戲自動匹配演算法
计 算 机 图 形 学 ——主讲教师:王国省 授课老师:王国省 联系方式: 年12月4日5时42分
報告人:吳家麟教授 資訊網路與多媒體研究所 資訊工程學系暨研究所
第三章 基本觀念 電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image
中国科技大学软件学院 School of Software Engineering
中国科技大学计算机科学与技术学院 School of Computer Science & Technology
第三章 基本觀念 電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image
中国科技大学计算机科学与技术学院 School of Computer Science & Technology
老師 製作 休閒農場.
IEEE Computer Society 長亨文化事業有限公司.
實驗十一 使用SmartBits來測試Switch
外埔國小104學年度上學期期初校務會議 吳文芳 校長 104/09/02.
財務預測 財務預測的用途 法令相關規定 預測的基本認知 預測的方法 製作預測性報表 財務報表分析 Chapter 16 財務預測.
以色列理工学院 “工程与科学”暑期项目介绍
數位家庭中的人機介面研究.
臺中國小資訊研習 (運算思維).
呼神登山隊 2009年5月23日-6月3日 西藏旅遊紀實系列 日期:5月29日 行程:雅魯藏布江快艇行 歌曲:高原紅 .
自慢 社長的成長學習筆記 何飛鵬.
关于研究的若干问题 陈熙霖.
團體工作的倫理議題 CHAPTER 12. 團體工作的倫理議題 CHAPTER 12 團體工作的倫理議題 1.如果我有資格執行個別治療,那麼我也可以執行團體治療。 2.仔細而審慎地篩選團體成員,較符合專業倫理要求。 3.在團體治療開始前,讓成員能先有準備以便從團體中獲得最大利益,是非常重要的。
学术报告 文献检索与论文写作的几点体会 生态环境系.
轉換成二進位、八進位及十六進位 = ( ) = ( ) = ( )16.
Presentation transcript:

计算机视觉 Computer Vision 北京理工大学 计算机科学与工程系 2006年3月9日 Computer Vision Department of Computer Science @BIT

主讲: 贾云得 教 授 yjiar@bit.edu.cn 电话:68940955 助教: 王彦杰 博士生 主讲: 贾云得 教 授 yjiar@bit.edu.cn 电话:68940955 助教: 王彦杰 博士生 wangyanjie@bit.edu.cn 电话:86343158 课代表:刘颖 liuyingfan@bit.edu.cn 刘峡壁 讲师 liuxiabi@bit.edu.cn 电话:86343158 Computer Vision Department of Computer Science @BIT

课程教材: http://www.mcislab.org.cn/course/cv2006/ 参考教材: 贾云得 《机器视觉》科学出版社,2000 课程网页: http://www.mcislab.org.cn/course/cv2006/ Computer Vision Department of Computer Science @BIT

More Readings 1. James J. Gibson, “The Ecological Approach to Visual Perception”, Lawrence Erlbaum Associates, Inc. 1986. 2. David Marr, “A Computational Investigation into Human Representation and Processing of Visual Information”, Freeman Co. 1982, 中译本,视觉计算理论,姚国正等翻译,科学出版社,1988。 3. B.K.P. Horn,“Robot Vision,” The MIT Press, McGraw-Hill Book Co, 1986. Computer Vision Department of Computer Science @BIT

课程考核方式: 规则: 1. 书面作业和课堂测验 30分; 2. 上机作业 30分; 3. 期末考试 40分. 1. 书面作业和课堂测验 30分; 2. 上机作业 30分; 3. 期末考试 40分. 规则: 按时交作业(特殊情况须事先说明),过时不侯。 课堂测验包括测验学过的内容,也包括预习过内容。 上机作业要求能现场演示。 Computer Vision Department of Computer Science @BIT

第一章 概 论 Chapter 1 Introduction Computer Vision 第一章 概 论 Chapter 1 Introduction Computer Vision Department of Computer Science @BIT

1. 引言 智能机器: 能模拟人类的功能,能感知外部世界并有效地解决人所能解决问题. 智能机器: 能模拟人类的功能,能感知外部世界并有效地解决人所能解决问题. 感知系统:人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器官,其中约80%的信息是由视觉获取的.因此,对于智能机器来说,赋予机器以人类视觉功能对发展智能机器是及其重要的,也由此形成了一门新的学科—计算机视觉(也称计算机视觉或图像分析与理解等).计算机视觉的发展不仅将大大推动智能系统的发展,也将拓宽计算机与各种智能机器的研究范围和应用领域. 计算机视觉:研究用计算机来模拟生物外显或宏观视觉功能的科学和技术.计算机视觉系统的首要目标是用图像创建或恢复现实世界模型,然后认知现实世界. Computer Vision Department of Computer Science @BIT

2. 计算机视觉发展 20世纪50年代:主要集中在二维图像分析和识别上,如,光学字符识别,工件表面、显微图片和航空图片的分析和解释等.是模式识别的重要内容。 60年代MIT 的Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述.Roberts 的研究工作开创了以理解三维场景为目的的三维计算机视觉的研究.Roberts对积木世界的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景. 70年代,已经出现了一些视觉应用系统.70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“计算机视觉” ( Machine Vision) 课程,由B.K.P.Horn教授讲授. Computer Vision Department of Computer Science @BIT

MIT AI Lab(现在和计算机科学实验室合并为CSAI Lab)吸引了国际上许多知名学者参与计算机视觉的理论、算法、系统设计的研究,David Marr教授就是其中的一位.他于1973年应邀在MIT AI 实验室领导一个以博士生为主体的研究小组,1977年提出了不同于"积木世界"分析方法的计算视觉理论(computational vision),该理论在80年代成为计算机视觉研究领域中的一个十分重要的理论框架. Computer Vision Department of Computer Science @BIT

研究热潮是从 20世纪80年代开始的,到了80年代中期,计算机视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等. Marr的计算理论 Computer Vision Department of Computer Science @BIT

许多会议论文集都反应了该领域的最新进展,比如: Int. Conf. on Computer Vision and Pattern Recognition (CVPR); Int. Conf. on Computer Vision(ICCV); European Conf. on Computer Vision(ECCV); Asian Conf. on Computer Vision(ACCV); . Int. Conf. on Pattern Recognition(ICPR); 还有许多学术期刊也包含了这一领域的最新研究成果, 如: Int. J on Computer Vision(IJCV); IEEE Trans. on Pattern Analysis and Machine Intelligence(PAMI); IEEE Trans. on Image Processing. Pattern Recognition; Image and Vision Computing; Pattern Recognition Letter; Computer Vision Department of Computer Science @BIT

3. Marr的视觉计算理论 Marr 的视觉计算理论[Marr1982]立足于计算机科学,系统地概括了心理生理学、神经生理学等方面取得的所有重要成果,是视觉研究中迄今为止最为完善的视觉理论. Marr 建立的视觉计算理论,使计算机视觉研究有了一个比较明确的体系,并大大推动了计算机视觉研究的发展.人们普遍认为,计算机视觉这门学科的形成与Marr的视觉理论有着密切的关系. Marr的视觉理论中的哲学意义和方法论. Marr 奖(iccv best paper ) Fu奖(icpr best paper ) 信息处理三个层次 Computer Vision Department of Computer Science @BIT

人脑不同于计算机是因为前者信息是并行加工的,后者是串行加工的,这种观点是错误的。 3.1 信息处理三个层次 人脑不同于计算机是因为前者信息是并行加工的,后者是串行加工的,这种观点是错误的。 Computer Vision Department of Computer Science @BIT

3.2 视觉表示框架 第一阶段(也称为早期阶段)是将输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图(primitive sketch); 第二阶段(中期阶段)是指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图(2.5 dimensional sketch); 第三阶段(后期阶段)是在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。 Computer Vision Department of Computer Science @BIT

3.3 Marr 视觉理论的不足 Marr理论是计算机视觉研究领域的划时代成就,但该理论不是十分完善的,许多方面还有争议.比如: 视觉处理框架基本上是自下而上,没有反馈; 没有足够地重视知识的应用. Marr理论给了我们研究计算机视觉许多珍贵的哲学思想和研究方法,同时也给计算机视觉研究领域创造了许多研究起点。 视觉系统 Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

4. 计算机视觉的应用 零件识别与定位 (工业生产线) 产品检验 (纺织工业棉花质量检验) 移动机器人导航(星球机器人) 产品检验 (纺织工业棉花质量检验) 移动机器人导航(星球机器人) 遥感图像分析(植被分析) 医学图像分析(骨骼定位) 安全鉴别、监视与跟踪(门禁系统) 国防系统(目标自动识别ATR与目标跟踪) 其它(动画、体育、考古) Computer Vision Department of Computer Science @BIT

Sojourner 火星车前部图,中部的两个小突出是两个黑白CCD摄像机 Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Rocky 7 火星车 勇气号火星车 Mobile Robot Testbed Computer Vision Department of Computer Science @BIT

Rocky7 视觉系统对场景的深度恢复 (a) 深度图象 (b)障碍物探测示意图 Computer Vision Department of Computer Science @BIT

CMU月球探测实验车Nomad漫游者 Computer Vision Department of Computer Science @BIT

月球探测实验车Nomad漫游者 Computer Vision Department of Computer Science @BIT

足球机器人 昆虫机器人 足球机器人 Computer Vision Department of Computer Science @BIT

日本 Honda 仿人机器人 Computer Vision Department of Computer Science @BIT

具有立体视觉的机器人 Computer Vision Department of Computer Science @BIT

人头部跟踪演示 Computer Vision Department of Computer Science @BIT

鱼眼图像 全像图像 Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

MIT Media Lab ,与虚拟生物交互演示 Computer Vision Department of Computer Science @BIT

虚拟现实中的媒体计算问题 Computer Vision Department of Computer Science @BIT

人机交互中的媒体计算问题(One more video) Computer Vision Department of Computer Science @BIT

基于图象序列的三维人脸恢复 Computer Vision Department of Computer Science @BIT

5. 计算机视觉研究的五大研究内容 一、输入设备(input device) 包括成像设备和数字化设备.成象设备是指通过光学摄像机或红外、激光、超声、X射线对周围场景或物体进行探测成象,得到关于场景或物体的二维或三维数字化图像. 二、低层视觉(low level) 主要是对输入的原始图像进行处理.这一过程借用了大量的图像处理技术和算法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角点、边缘、线条、边界以及色彩等关于场景的基本特征;这一过程还包含了各种图像变换(如校正)、图像纹理检测、图像运动检测等. Computer Vision Department of Computer Science @BIT

6. 计算机视觉研究的五大研究内容 三、中层视觉(middle level) 主要任务是恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息,实现的途径有立体视觉(stereo vision)、测距成像(rangefinder)运动估计(motion estimation)、明暗特征、纹理特征等所谓的从X恢复形状的估计方法.系统标定、系统成像模型等研究内容一般也是在这个层次上进行的. 四、高层视觉(high level) 主要任务是在以物体为中心的坐标系中,在原始输入图像、图像基本特征、2.5维图的基础上,恢复物体的完整三维图,建立物体三维描述,识别三维物体并确定物体的位置和方向. Computer Vision Department of Computer Science @BIT

7. 计算机视觉研究的五大研究内容 五、体系结构(system architecture)这一术语最通常的含义系指在高度抽象的层次上,根据系统模型而不是根据实现设计的具体例子来研究系统的结构.为了说明这一点,可以考虑建筑设计中某一时期的建筑风格(如清朝时期)和根据这一风格设计出来的具体建筑之间的区别.体系结构研究涉及一系列相关的课题:并行结构、分层结构、信息流结构、拓扑结构以及从设计到实现的途径. Computer Vision Department of Computer Science @BIT

8. 计算机视觉研究面临的困难 (1) 图像多义性: 三维场景被投影为二维图像,深度和不可见部分的信息被丢失,因而会出现不同形状的三维物体投影在图像平面上产生相同图像的问题.另外,在不同角度获取同一物体的图像会有很大的差异. (2)环境因素影响:场景中的诸多因素,包括照明、物体形状、表面颜色、摄像机以及空间关系变化都会对成像有影响, (3)知识导引: 同样的图像在不同的知识导引下,将会产生不同的识别结果.. (4)大量数据: 灰度图像,彩色图像,深度图像的信息量十分巨大,巨大的数据量需要很大的存贮空间,同时不易实现快速处理. Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

Computer Vision Department of Computer Science @BIT

9. 计算机视觉与其它学科领域的关系 (1)图像处理:图像处理通常是把一幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成 (2)计算机图形学:通过几何基元,如线、圆和自由曲面,来生成图像,它在可视化(Visualization)和虚拟现实(Virtual Reality)中起着很重要的作用.计算机视觉正好是解决相反的问题,即从图像中估计几何基元和其它特征.因此,计算机图形学属于图像综合,计算机视觉属于图像分析. (3)模式识别:用于识别各种符号、图画等平面图形.模式一般指一类事物区别于其它事物所具有的共同特征。模式识别方法有统计方法和句法方法两种,统计方法是指从模式抽取一组特征值,并以划分特征空间的方法来识别每一个模式 Computer Vision Department of Computer Science @BIT

10. 计算机视觉与其它学科领域的关系 (3)人工智能(AI):涉及到智能系统的设计和智能计算的研究.在经过图像处理和图像特征提取过程后,接下来要用人工智能方法对场景特征进行表示,并分析和理解场景.人工智能有三个过程:感知、认知和行动.. (4)媒体计算(MC):文字\图形\图像\动画\视频\音频等各类感觉媒体的共同基础计算理论、计算方法、算法,媒体系统实现技术。基础性和综合性,是以实现下一代计算机能听、能看、会说、会学习为目标。 (5)神经物理学与认知科学:将人类视觉作为主要的研究对象.计算机视觉中已有的许多方法与人类视觉极为相似.许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣,希望计算机视觉更加自然化,更加接近生物视觉 Computer Vision Department of Computer Science @BIT

11. 计算机视觉研究对策 研究人员不断寻求新的途径和手段,比如,主动视觉(active vision),面向任务的视觉(task-oriented vision),基于知识、基于模型的视觉,以及多传感融合和集成视觉等方法,其中人们越来越重视对知识的应用.我们会看到,计算机视觉系统的最大特征是,在视觉的各个阶段,系统尽可能地进行自动运算.为此,系统需要使用各种知识,包括特征模型、成像过程、物体模型和物体间的关系.如果计算机视觉系统不用这些知识,则其应用的范围及其功能将十分有限.因此,视觉系统应该使用那些可以被明确表示的知识,以使系统具有更高的适应性和鲁棒性.合理地使用知识不仅可以有效地提高系统的适应性和鲁棒性,而且可以求解计算机视觉中较难的问题. Computer Vision Department of Computer Science @BIT

12 作业: 自学1.6节,预习第二章 思考题: (1)通过上网查阅资料,给出计算机视觉的两种定义,标注定义的出),并给出评论。 (2)叙述计算机视觉涉及的几种坐标系。 Computer Vision Department of Computer Science @BIT