早上好!
视觉课程网址 http://opt.zju.edu.cn/vision/ 用 户 名:你的户名 登录密码:你的密码 用 户 名:你的户名 登录密码:你的密码 点击“资源下载”,即可下载
图形与图像识别 它们有什么不同吗?
你喜欢哪个“她”和“他”
第五章 形状与图形视觉及图像识别 章海军 张冬仙 (2011. 09. 28)
引子—视觉认知过程: 轮廓 形状 图形 图像 阴影产生轮廓 5/93
阴影产生轮廓
轮廓构成形状
轮廓构成形状
轮廓构成形状
轮廓构成形状 10/93
形状组成图形
形状组成图形
形状组成图形 中 国
平湖 春晓
平湖 春晓
复杂图形构成图像
视觉如何识别 形状、图形与图像?
5.1 形状与图形视觉 41 轮廓的作用 轮廓:明度级差的突然变化 明度的渐变不产生轮廓 !
轮廓不等于形状(相同的轮廓,不同的形状) 形状:由轮廓将之与其他部分分离的主体 轮廓不等于形状(相同的轮廓,不同的形状) A B
相同的轮廓,不同的形状
主观轮廓:在无明度级差时由于某种原因看到的轮廓 主观轮廓(一) 20/93
主观轮廓(二)
动态主观轮廓
马赫效应=轮廓的对比增强
经冲动低于单独受刺激时的神经冲动。视细胞亦然。 侧抑制: 鲎眼相邻小眼同时受刺激时,每个小眼的神 经冲动低于单独受刺激时的神经冲动。视细胞亦然。
对比增强:视细胞的侧抑制作用所造成 其他例子?
时隐时现的彩点
空间框架对形状的影响 30/93
图形:由简单刺激构成的视觉客体
图形的组织原则与规律 图形与背景的分离 明度分离 运动分离 工工工工工工工工工工工工工工 图形的组织原则与规律 图形与背景的分离 明度分离 运动分离 工工工工工工工工工工工工工工 工工工工工工工工工工工工工工工工工图图图图图图图图工工工工工工图图图图图图图图工工工工工工工工工图图工工工工工工工工工工工工图图工工工工工工工工工工工工图图工工工工工工工工工工工工图图工工工工工工工工工图图图图图图图图工工工工工工图图图图图图图图工工工工工工工工工工工工工工工工工
结构在图形-背景分离中的主导作用 35/93
结构在图形-背景分离中的主导作用
你 能 从 背 景 中 看 到 什 么
图形的接近性:较接近的部分易被视作整体
图形的相似性:相似的图形,易被视作整体
34/73 图形(图像)的相似性
图形的连续性:具有一定顺序的成分易成整体
图形的封闭性:封闭的图形易被视作整体
图形的良好性:有意义的图形易成整体
图形的良好性 毕 加 索 : 和平鸽 45/93
毕 加 索 : 女 人 和 花 图 形 的 良 好 性 ?
毕 加 索 : ?
心理学因素:主观定势与经验的影响。
图形的掩蔽 认知性掩蔽 50/93
图形的掩蔽 认知性掩蔽
图形的掩蔽 认知性掩蔽
图形的掩蔽 认知性掩蔽
形状、图形视觉理论 如:接近性、相似性、连续性、封闭性等是 所得,是神经细胞联合作用的结果。 外界事物固有的空间特性。 形状、图形视觉理论 格式塔学说:形状视觉与生俱来。 客观学说:形状视觉是客观刺激的主观映像。 如:接近性、相似性、连续性、封闭性等是 外界事物固有的空间特性。 Hebb细胞联合学说:形状视觉为后天学习 所得,是神经细胞联合作用的结果。 眼动的作用。
5.2 视觉对图像的识别 图像: 由复杂刺激构成,曾经经验过的有意义的客体。 人眼对图像识别的特点 图像: 由复杂刺激构成,曾经经验过的有意义的客体。 人眼对图像识别的特点 从大量视觉信息中识别出熟悉的图像或客体。 例:从很多人中认出熟人。 外国人?动物? 找到回家的路。 蜜蜂、蚂蚁?! 快速阅读文字。 阿拉伯文?甲骨文? 看懂一幅图像或图画。 抽象画? 55/93
严格而言,这不是真正的图像
图像:由复杂刺激构成的、曾经经验过的 视觉客体。 图像(一)
图像识别——与过去的经验、模板、特征等相匹配
旋转使视觉结果变化
60/93
图像识别理论 (与计算机视觉有直接关系) 图像识别理论 (与计算机视觉有直接关系) 模板匹配(template matching) 与过去经验过、记忆过的模板匹配 识别 例:杯子。 亿万种模板?
应用例:身份证识别技术…… S F Z M J
人民币防伪与识别 2005年版 1999年版
模板匹配理论的反例——并不存在记忆过的模板
模板 = 图像的相似性 实现识别 例:A & 原型匹配(prototype matching) AAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAA 中国浙江杭州浙江大学中国浙江杭州浙江大学 65/93
原型匹配在图像识别中的应用实例
原型匹配理论的局限性——相似性程度太高时误识别
原型匹配理论的局限性——相似性程度太高时误识别 70/92
不相似的双胞胎
原始图像 图像处理与识别的一般步骤 灰度图像 滤波/边缘检测/分割 特征提取/匹配 识别
全世界使用最广泛的原始图像
灰度图像 边缘检测/特征提取
原型匹配与特征匹配应用例—生物识别技术 特点: 优势: 应用领域: 利用生物的生理特征或行为特征作为识别依据 防伪性能好 唯一性、稳定性好,识别精度高 不易遗忘或丢失 应用领域: 国家安全 金融 电子商务 刑侦破案
人脸识别 虹膜识别 语音识别 签字识别 指纹识别 其他 人脸识别 虹膜识别 指纹识别
华为创新研究计划项目2011指南
特征匹配(feature matching) 应用例一:指纹识别技术及应用 …… 41 70/93
应用例二:掌纹识别技术及应用…… 原图 平滑滤波 灰度均衡 线检测 细化 去孤点
5.3 视错觉 几何图形错觉 眼球运动说 图5-20
穿横条衣服显得更胖?
穿 横 条 衣 服 显 得 更 瘦
白线与哪一根线段对准?
透视或常性误用说
透视或常性误用 75/93
透视或常性误用
对比和同化说
混淆和错误比较说 a b c
明暗错觉
明暗错觉 80/93
螺旋与拧绳错觉
形状与面积错觉 43
大小与面积错觉
大小与面积错觉
方向错觉 85/93
日月大小错觉 孩子问:太阳早晚大?中午大? 孔子曰:I don’t know ! 地平线说 远近、高低经验说 双眼视轴集合说
今天是什么日子? 孔子2562岁生日!
Happy Birthday to Confucius ! BC 551-479 生日:9月28日
不可能图形
5.4 图形后效 图形后效:受某种前提刺激影响(适应) 后而产生的异常图形视觉现象。 分 类:形变后效、倾斜后效、空间频 5.4 图形后效 图形后效:受某种前提刺激影响(适应) 后而产生的异常图形视觉现象。 分 类:形变后效、倾斜后效、空间频 率后效、运动后效、附随性后 效、单眼特定后效、双眼特定 后效、瀑布后效等。
44 运动后效