计算机视觉 Computer Vision 艾海舟 2011年3月 Sept.17, 2010.

Slides:



Advertisements
Similar presentations
MOOCs 与计算机课程建设 高等教育出版社 张龙 2013 年 12 月 15 日 海南 · 海口.
Advertisements

开放大学的教学改革 国家开放大学学习资源部 杨孝堂 研究员 2015年9月.
第6章 股票市场上的投资者.
2015年6月论文头脑风暴 大连理工大学 郭君
資訊概論 INTRODUCTION TO INFORMATION SCIENCE
第五章 資訊科技基礎建設與新興科技.
資訊科技挑戰獎勵計劃 樂善堂梁銶琚學校 6A(06)陳芷蘊 中華白海豚. 資訊科技挑戰獎勵計劃 樂善堂梁銶琚學校 6A(06)陳芷蘊 中華白海豚.
王晨 指导教师:张军平副教授 复旦大学计算机科学技术学院 上海市智能信息处理重点实验室
小學四年級常識科 食物的消化.
汇报人:李臻 中国海洋大学信息科学与工程学院 计算机科学与技术系
自衛消防編組任務職責 講 義 This template can be used as a starter file for presenting training materials in a group setting. Sections Right-click on a slide to add.
数字图像处理 Digital Image Processing.
人脸识别--LBP 周稻祥.
視聽資料之定義 視聽資料 非書資料 多媒體資料.
Digital Signal Processing 授课教师:胡慧珠
Manifold Learning Kai Yang
Excellence in Manufacturing 卓 越 制 造
異質計算教學課程內容 「異質計算」種子教師研習營 洪士灝 國立台灣大學資訊工程學系
Special English for Industrial Robot
計算方法設計與分析 Design and Analysis of Algorithms 唐傳義
第十章 基于立体视觉的深度估计.
研究、論文、計畫與生活之平衡 演講人:謝君偉 元智大學電機系 2018年11月22日.
移动系统的安全: 攻击和防御 杜文亮 教授 Dept. of Elec. Eng. & Comp. Sci.
显著物体分割 探秘与思考 Yin Li, Georgia Tech
Digital Image Processing
Decision Support System (靜宜資管楊子青)
Image Segmentation with A Bounding Box Prior
信号与图像处理基础 An Introduction to Signal and Image Processing 中国科学技术大学 自动化系
Shape(Structure) From X
射影幾何於攝影測量上之應用 Projective Geometry in Photogrammetry
光流法 (Optical Flow) 第八章 基于运动视觉的稠密估计 光流法 (Optical Flow)
數位學習專題 (Special Topics on eLearning)
Quantum Computer B 電機三 莊子德
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
第三章 基本觀念 電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image
VI. Brief Introduction for Acoustics
邏輯設計 Logic Design 顧叔財, Room 9703, (037)381864,
人機介面 Pen-Based Interface 筆跡介面
VISP+MS 国际高校访问学生 及统计理学硕士项目
Source: IEEE Transactions on Image Processing, Vol. 25, pp ,
BEd(Special Education)
Decision Support System (靜宜資管楊子青)
第二章 資訊管理的科技觀點.
计算机视觉 Computer Vision 北京理工大学 计算机科学与工程系 2006年3月9日 Computer Vision
第三章 基本觀念 電腦繪圖與動畫 (Computer Graphics & Animation) Object Data Image
Introduction 2. Radial Basis Function (RBF)
電子商務 E-Commerce.
資料結構 Data Structures Fall 2006, 95學年第一學期 Instructor : 陳宗正.
VIDEO COMPRESSION & MPEG
基于人眼追踪的手机解锁系统 报告人:李映辉 指导老师:王继良
Chapter 8 Model Inference and Averaging
Total Review of Data Structures
Error Control Coding Spring 2016 Course Syllabus
Chapter 04 流程能力與績效分析.
Part5-Chapter 1 餐旅人力資源 管理的內涵 本章研習重點 1. 說明管理的定義。 2. 瞭解人力資源管理的定義。
计算机图形学 姜明 北京大学数学科学学院 更新时间2019年4月25日星期四8时14分39秒.
第九章 明暗分析 Shape from Shading SFS SFM SFC SFT …… SFX.
(二)盲信号分离.
An Quick Introduction to R and its Application for Bioinformatics
第十四章 二维运动估计 图像动态变化可能由摄象机运动、物体运动或光照改变引起,也可能由物体结构、大小或形状变化引起.
數位家庭中的人機介面研究.
Fast Image Dehazing Algorithm using Morphological Reconstruction
Operating System Software School of SCU
Chapter 0 Introduction to Medical Image Processing
关于研究的若干问题 陈熙霖.
Term Project : Requirement
Principle and application of optical information technology
4.理財規劃者適格性分析與實作 理財規劃重點 生涯階段 「就業前準備階段」(學習階段) 「初入社會階段」 「確定職涯階段」 「維持職涯階段」
國立中正大學資工系系主任 數位學習中心主任
Gaussian Process Ruohua Shi Meeting
Presentation transcript:

计算机视觉 Computer Vision 艾海舟 2011年3月 Sept.17, 2010

Outline 课程目标,资料来源,授课方式… 教材与参考书、作业、课程设计、考核方式 Web sites FTP sources Tools (Intel OpenCV, IPL,…) Demo 相关学科与相关课程的联系 Overview Introduction recommended:Forsyth’s introduction to CV, other related Sept.17, 2010

课程目标,资料,授课方式 目标 资料 授课方式 全面了解计算机视觉研究领域,掌握基本原理,具有一定的实践能力。 使用网上公开的资料,挑选、推荐各种资料(ppt,pdf,codes,etc.),并直接使用我认为合适的讲稿进行讲解。 授课方式 课堂上全面介绍基本原理,引导资料阅读;课后需要学生阅读相关文献,消化理解。如有时间,建议课前预习。 Sept.17, 2010

学习方法的建议 根据自己学习本门课程的目的考虑投入时间 根据自己研究方向有所侧重 结合自己的研究课题加深相关基础知识 一般了解、掌握、精通 有选择地专研部分内容 将精读与一般了解相协调 将建立基础知识与把握当前研究热点相结合 结合自己的研究课题加深相关基础知识 了解本方向的研究情况,研究趋势等。 Sept.17, 2010

实践:课程设计、专题研究 实践非常重要,CV是实验学科,脱离实践,很难有所收获。 课程设计(程序作业) 专题研究 可以使用OpenCV工具, 可以使用Mathlab工具, 充分利用其他网上资源 专题研究 结合自己的课题,挑选论文精读, 实现论文中的方法, 分析存在的问题,如何解决,如何改进,…… Sept.17, 2010

教材 英文原版:Szeliski, Richard, Computer Vision: Algorithms and Applications, Springer, Oct., 2010 中文翻译版:艾海舟,兴军亮 等, 《计算机视觉:算法与应用》,2011年 x月(预计2011年内出版);清华大学出版社 英文影印版:DA Forsyth and J. Ponce, Computer Vision: A Modern Approach, Prentice Hall. 1st edition (August 14, 2002) ; 清华大学出版社 中文翻译版:林学言,王宏 等, 《计算机视觉:一种现代的方法》,2004年6月;电子工业出版社 Sept.17, 2010

参考书 马颂德,张正友,《计算机视觉》,科学出版社,北京,1998。 R. Jain, R. Kasturi and B. G. Schunck, Machine Vision, McGraw-Hill companies, Inc. 机械工业出版社, 2003.8。 L.G. Shapiro and G.C. Stockman, Computer Vision, Prentice Hall Inc, 2001. M. Sonka, V. Hlavac, and R. Boyle, Image processing, analysis, and machine vision , Chapman & Hall Computing, London, 3rd Edition, THOMSON Learning, 2008. M. Sonka, V. Hlavac, and R. Boyle, (艾海舟、苏延超 等译), 图像处理、分析与机器视觉(第3版),清华大学出版社, 2011.1。 章毓晋,图象工程 (第2版),清华大学出版社, 2007.5 Sept.17, 2010

参考书(模式识别与机器学习) Christopher M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006.8 R.O. Duda,P.E. Hart and D.G. Stork, Pattern Classification,机械工业出版社,2003.6。 R.O. Duda, P.E. Hart and D.G. Stork (李宏东,姚天翔等译) , 模式分类,机械工业出版社,2003.9。 S. Theodoridis and K. Koutroumbas, Pattern Recognition, 机械工业出版社,2003.9。 边肇祺,张学工 等,模式识别,清华大学出版社,2000. Sept.17, 2010

参考书(图像处理) R.C. Gonzalez, R.E. Woods,Digital Image Processing, 第三版 (影印) 电子工业出版社& Pearson Education, 2010. R.C. Gonzalez, R.E. Woods, (阮秋琦、阮宇智等译),数字图像处理,第二版,电子工业出版社& Prentice Hall, 2003. 章毓晋,图象工程 (第2版),清华大学出版社, 2007.5 郎锐,数字图像处理学Visual C++实现,北京希望电子出版社,2002.12 周长发,精通Visual C++图像编程,电子工业出版社,2000.1 Sept.17, 2010

作业、课程设计、考核方式 书面作业 课程设计 考核方式 书面作业 10% 课程设计 60% 期末考试 30% Sept.17, 2010

Web sites (1) ---Search Engine CVPapers - Computer Vision Resource http://www.cvpapers.com/ Google search computer vision Computer vision homepage Computer vision online Computer vision source codes Computer vision test data Computer vision …. Paper search http://www.researchindex.com Sept.17, 2010

Web sites (2) ---Courses 计算机视觉 Slides and lectures of Szeliski’s book’s supplementary material UW455: Undergraduate Computer Vision, http://www.cs.washington.edu/education/courses/455/. UW576: Graduate Computer Vision, http://www.cs.washington.edu/education/courses/576/. Stanford CS233B: Introduction to Computer Vision, http://vision.stanford.edu/teaching/cs223b/. MIT 6.869: Advances in Computer Vision, http://people.csail.mit.edu/torralba/courses/6869/6.869.computervision.htm. Berkeley CS 280: Computer Vision, http://www.eecs.berkeley.edu/trevor/CS280.html. UNC COMP 776: Computer Vision, http://www.cs.unc.edu/lazebnik/spring09/. Middlebury CS 453: Computer Vision, http://www.cs.middlebury.edu/schar/courses/cs453-s10/. Sept.17, 2010

Web sites (3) ---Course Ware 计算机视觉”课程的网上课件入口 Computer Vision Education Digital Library Collection http://cved.org/ Computer Vision http://www.cs.washington.edu/education/courses/576/CurrentQtr/ Introduction to Computer Vision http://www.cse.psu.edu/~cg486/ Learning and Inference in Vision www.ai.mit.educourses6.899 Sept.17, 2010

Web sites (4) --- Codes, tutorial,etc. KLT: An Implementation of the Kanade-Lucas-Tomasi Feature Tracker http://www.ces.clemson.edu/~stb/klt/installation.html Epipolar geometry, essential matrix, etc: online tutorial http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/EPSRC_SSAZ/node18.html RANSAC http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/FISHER/RANSAC/ ………. Sept.17, 2010

Tools (1) Intel OpenCV (Open source Computer Vision library) This library allows high level functions for computer vision and image processing. OpenCV offers many high-level data types such as sets, trees, graphs, matrices. . . OpenCV is open source to run on many computer platforms. High level functions such as Camera calibration (Zhang Zhengyou’s method) Face detection (a variation of Viola-Jones’s detector) Motion analysis and object tracking Optical flow Lucas-Kanade algorithm Estimators Kalman Condensation Sept.17, 2010

Tools (2) Intel IPP (Integrated Performance Primitives) It is a signal processing, image processing and matrix calculation library developed by Intel Corporation. IPP offers to programmers a wide range of low-level functions which are optimized when used on an Intel processor (from Pentium to Itanium). It is really a good library for signal, image, video and sound processing with very good performances due to optimized instructions. IPP is not a free library, it comes under an Intel licensing policy which is explained at Intel website Sept.17, 2010

demo Face detection Object contour tracking Motion object detection and tracking ASM/AAM shape modeling Perceptual interface: smart room Visual surveillance Robotics vision 3D modeling, face animation ……… Sept.17, 2010

相关学科与相关课程的联系 重叠量反应相关程度 集合论 机器视觉 线性代数 计算机视觉 高等代数 数字图象处理 最优化方法 模式识别 计算机图形学 集合论 重叠量反应相关程度 计算几何 机器视觉 线性代数 计算机视觉 高等代数 数字图象处理 最优化方法 模式识别 。。。。。。。。。。。。 高级语言程序设计 计算机视觉专题(图象与视觉计算) 数据结构 信号与系统 基础知识 先后顺序 Sept.17, 2010

Overview (1) 计算机视觉的几何学基础 摄像机模型 运动估计 几何重构(Geometry reconstruction) 单摄像机(pinhole model/perspective transformation) 双摄像机 (epipolar geometry: fundamental matrix/essential matrix) 三摄像机及更多(multi-view geometry) 运动估计 对应点问题(correspondence problem) 光流计算方法 刚体运动参数估计(minimal projective reconstruction) 2-view, 7 points in correspondence; (Faugeras) 3-view, 6 points in correspondence; (Quan Long) 3-view, 8 points with one missing in one of the three view. (Quan Long) 几何重构(Geometry reconstruction) 立体视觉(stereo vision) Shape from X (shading/motion/texture/contour/focus/de-focus/….) Sept.17, 2010

Overview (2) 计算机视觉的物理学基础 摄像机及其成像过程 光学/色彩 light/color 物体表面特性 视点、光源、空间中光线、表面处的光线…. 明暗 shading、阴影 shadow 光学/色彩 light/color 辐射学,辐照率…radiometry, 物体表面特性 漫反射表面(各向同性)Lambertian surface BDRF (bi-directional reflectance distribution fucntion) Sept.17, 2010

Overview (3) 计算机视觉的图像模型基础 摄像机模型及其校准 图像特征 图像序列特征 (运动) 内参数、外参数 边缘、角点、轮廓、纹理、形状… 图像序列特征 (运动) 对应点、光流 Sept.17, 2010

Overview (4) 计算机视觉的信号处理层次 低层视觉处理 中层视觉处理 高层视觉处理 应用 单图像:滤波/边缘检测/纹理 多图像:几何/立体/从运动恢复仿射或透视结构 affine/perspective structure from motion 中层视觉处理 聚类分割/拟合线条、曲线、轮廓 clustering for segmentation, fitting line… 基于概率方法的聚类分割/拟合 跟踪 tracking 高层视觉处理 匹配 模式分类/关联模型识别 pattern classification/aspect graph recognition 应用 距离数据(range data)/图像数据检索/基于图像的绘制 Sept.17, 2010

Overview (5) 计算机视觉的数学基础 摄影几何、微分几何 概率统计与随机过程 数值计算与优化方法 机器学习 计算机视觉的基本的分析工具和数学模型 Signal processing approach: FFT, filtering, wavelets, … Subspace approach: PCA, LDA, CCA, ICA, … Bayesian inference approach: EM, Condensation/SIS/…, MCMC, …. Machine learning approach: SVM/RVM/Kernel machine, Boosting/Adaboost, NN/Regression, … HMM, BN/DBN, … Gibbs, MRF, … Sept.17, 2010

Overview (6) 计算机视觉问题的特点 高维数据的本质维数很低,使得模型化成为可能。 问题的不适定性 缺少约束的逆问题 优化问题 High dimensional image/video data lie in a very low dimensional manifold. 问题的不适定性 缺少约束的逆问题 优化问题 Sept.17, 2010

Introduction Recommended Forsyth’s introduction to CV Ullman’s introduction to Computer and Human Vision (part 1) Ullman’s introduction to Computer and Human Vision (part 2) Seitz’s conclude on CV Sept.17, 2010

CV 文献 杂志 IJCV, PAMI, CVIU, PR, IVC等 会议 ICCV, CVPR, ECCV, FG, ACCV, ICPR, ICIP 等 Sept.17, 2010