第二章 图像和视觉基础 图象处理的研究需要了解人类视觉机理: 人们能够区分的光强度差别有多大?

Slides:



Advertisements
Similar presentations
性别决定与伴性遗传. ( 一 ) 性别决定 1 、概念 2 、常染色体与性染色体常染色体与性染色体 3 、性别决定的类型性别决定的类型 ( 二 ) 伴性遗传 1 、概念概念 2 、色盲及其遗传特点 3 、血友病遗传 雌雄异体的生物决定性别的方式.
Advertisements

《公路纵断面设计》 —— 纵断面设计的要求 道桥系 二○○七年五月. 纵断面设计的一般要求 1 .纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 .为保证汽车能以一定的车速安全舒顺地行驶,纵坡应具有 — 定 的平顺性,起伏不宜过大及过于频繁。尽量避免采用极限纵坡 值.缓和坡段应自然地配合地形设置,在连续采用极限长度的.
展览空间设计. 一、概述: 1 、 “ 展示 ” 的定义: 以综合物、人、场等要素 最佳空间关系为手段,以传 达特定信息为目的的展览、 演示活动。
第 2 讲 计算机中的颜色表示 1 如何刻画颜色 2 如何计算颜色 如何 “ 刻画 ” 颜色.
大学物理实验 第一讲 南昌大学物理实验中心 2013年2月.
第三章 图像处理技术 第三章 多媒体图像处理技术.
广告及物料类型培训 印刷、喷绘篇.
第2章图像的基本知识及运算 专业术语及表示方法 图像与视觉之间的关系 图像象素间的关系 图像间的运算.
2011级高考地理复习(第一轮) 第三篇 中国地理 第一章 中国地理概况 第五节 河流和湖泊.
工程光学 2010年2月.
第2节 伴性遗传 学习目标: 1.认识性别决定的类型与性染色体的关系, 性别决定的两种类型(XY型和ZW型)。
性别决定与伴性遗传 性别决定 伴性遗传 巩固练习.
CCD应用技术综合实验 中国计量学院光学与电子科技学院 制作人:余向东.
判断推理,必须学会这些 主讲老师:小胡胡 2016年3月25日20:00 YY频道:
餐旅督導實務 指導老師:梁中正 組員: 蘇珮玲999M0151.
普 通 话.
建筑业2007年年报 2008年定报培训会 及 工交城建科 蔡婉妮
小学语文毕业总复习 ( 基础知识部分) 牡丹区实验小学侯宪梅.
第 18 章 干涉與繞射.
第三课 走向自立人生.
第三节 大气环境 第一课时 对流层大气的受热过程.
補救教學實施策略 國立新竹教育大學 高淑芳.
第一单元 人在社会中生活 综合探究一 从地图上获取信息 第1课时 带着地图定向越野间.
忠孝國小自立午餐老師的叮嚀 教師指導手冊.
清仓处理 跳楼价 满200返160 5折酬宾.
华东师范大学 软件工程硕士答辩名单 时间:2016年5月14日、15日.
人口调查报告 有专家认为,在2002年全国出生的1604万人中,男孩比女孩多了近150万人;如果照此发展,20年后全国因出生原因造成的男女性别不平衡人口则多达3000万人!
Xi' an Polytechnic University
性别决定与伴性遗传.
让我们快快乐乐.
致亲爱的同学们 天空的幸福是穿一身蓝 森林的幸福是披一身绿 阳光的幸福是如钻石般耀眼 老师的幸福是因为认识了你们 愿你们努力进取,永不言败.
1.1.2 四 种 命 题.
高一数学 充分条件与必要条件 教育科学学院03级教育技术2班 刘文平.
受力分析 力的正交分解 虎山中学 高一(7)、(8)、(9)班.
我国三大自然区.
专题一 种群和群落 [考纲要求] 1.种群的特征(Ⅰ)。2.种群的数量变化(Ⅱ)。3.群落的结构特征(Ⅰ)。4.群落的演替(Ⅰ)。
物 资 供 应 简 报 第三期 2014年3月 中铁二局物资重庆分公司项目物资简报.
色彩基本認識 2010 年 9 月 Hsiu-fen Wang
1.5 地球运动的地理意义(一) 自 转意义 一、昼夜交替 昼夜现象 1、昼夜更替 周期是24小时(1太阳日) 地球是一个不发光
第三节 性别决定和伴性遗传  染色体组型  性别决定  伴性遗传.
第20章 生物的遗传和变异 第四节 性别和性别决定 淮南二十六中 鲍娟娟. 第20章 生物的遗传和变异 第四节 性别和性别决定 淮南二十六中 鲍娟娟.
出入口Y27 往塔城街口/中興醫院 出入口Y25 往延平北路一段/中興醫院 出入口Y23往延平北路一段 出入口Y21往延平北路一段
第4章 种群和群落 第3节 群落的结构 自主学习案   合作探究案 课后练习案. 第4章 种群和群落 第3节 群落的结构 自主学习案   合作探究案 课后练习案.
行程設計、登山計畫與山難留守 講師:張志湧.
第8章 彩色图像处理 内容提要: 8.1 人类视觉与色度学基础 8.2 颜色空间的表示及其转换 三基色原理、光度学基本知识
光度与辐射度基础 武汉约克仪器公司 郑兆平
建國國小英語教學線上課程 字母拼讀篇(一) 製作者:秦翠虹老師、林玉川老師.
5-6 光與生活 視覺暫留 發光強度與照度.
第六章 弯 曲 强 度.
2 数字图像基础 赵国庆 博士 北京师范大学教育技术学院
影像處理軟身操 數位影像的基本觀念與實作 劉明玲主講.
Image Chen Ching-Jung 「影像處理」入門 高一.資訊科技概論 Image Chen Ching-Jung.
LED辐射强度空间分布 及半值角的测量 一、实验目的 1. 了解LED发光的空间特性,了解半值角的概念和它的意义;
第一章 數位影像的概念.
Ch2 空間中的平面與直線 2-2 空間中的直線 製作老師:趙益男/基隆女中教師 發行公司:龍騰文化事業股份有限公司.
網路遊戲版 幸福農場168號.
风光互补LED路灯成功案例分析 (演讲方——深圳市泓昱照明科技有限公司)
第八章 真实感图形的绘制 第一 用数学方法建立所构造三 维场景的几何描述,并将 它们输入至计算机。 第二 将三维几何描述转换为二 维透视图。
色彩基本認識 2006 年 10 月 Hsiu-fen Wang.
二元一次聯立方程式 代入消去法 加減消去法 自我評量.
MICROMEGAS位置编码 读出研究 胡荣江, 段利敏, 杨贺润, 鲁辰桂, 李祖玉, 靳根明, 马朋 中科院近代物理研究所
電子白板百萬小學堂 本活動建議搭配電子白板 學生最多可分成2~6組(請按組別按鈕) 老師可以視時間多少,來進行活動 每一組要回答十個問題。
第六章 静定桁架的内力分析.
性別的關鍵 區分 XY型 XO型 ZW型 單性生殖 決定因素 精子 卵 卵是否受精 ♂的染色體 XY X ZZ n ♀的染色體 XX ZW
火藥 與 焰火 中國四大發明中之一 與 文化藝術.
《手把手教你学STM32》 主讲人 :正点原子团队 硬件平台:正点原子STM32开发板 版权所有:广州市星翼电子科技有限公司 淘宝店铺:
实训7:屈光检查 天津职业大学眼视光工程学院 王海英.
数学题解答 第二章 一元一次方程 2.1从算式到方程 (第1课时) 数学题解答
第二章 数字图像处理基础 2.1 图像数字化技术 2.2 数字图像类型 2.3 图像文件格式 2.4 色度学基础与颜色模型.
学生伤害及其预防控制 北京市疾病预防控制中心 学校卫生所 耳玉亮.
Presentation transcript:

第二章 图像和视觉基础 图象处理的研究需要了解人类视觉机理: 人们能够区分的光强度差别有多大? 我们眼睛的空间清晰度是多少?对运动的感觉如何? 我们估计和比较距离和面积的精度是多少? 人类特性视觉的光谱是如何样的? 人的视觉中彩色起什麽作用? 人类是如何获得视觉感知,如何认知周围事物的? 人们对于自己视觉机构的生物、生理物理过程的了解,以及神经、精神方面的了解还处于低级阶段,认识还很不完善和有局限性。

人类视觉感知能力的特点 人类视觉系统在对物体的识别上有特殊强大的功能;但在对灰度、距离和面积的绝对估计上却有某些欠缺; 以传感器单元的数目比较:视网膜包含接近1亿3000万至1亿5000万个光接收器,这远远大于一般数字成像系统CCD片上的传感器单元数; 和它每次执行运算的数目比较:和计算机的时钟频率相比,神经处理单元的开关时间将比之大约慢104倍; 总体而言,人类的视觉系统还是比计算机视觉系统要强大得多。它能实时分析复杂的景物以使我们能即时的反应。

100m 15m 2.55mm 17mm 中心凹 (成像区) 视觉低级感知层次 视觉系统从外界获取图象,就是在眼睛视网膜上获得周围世界的光学成象,然后由视觉接收器(杆状体和锥状体在视网膜上作为视觉接收器),将光图象信息转化为视网膜的神经活动电信息,最后通过视神经纤维,把这些图象信息传送入大脑,由大脑获得图象感知。

视网膜上有柱状体和锥状体两类视觉接收器: 视柱体(Rods):细长而薄,数量上约7500万~1亿5000万,它们提供暗视,即在较低数量级亮度时的视觉响应,其光灵敏度高。 视锥体(Cons):结构上短而粗,数量少,约600万~700万,光灵敏度较低,它们提供昼视,其响应光亮度范围比视柱体要高5~6个数量级。在中间亮度范围是两种视觉细胞同时起作用。视锥体集中分布在视网膜中心小凹里。

一、眼睛的成像机理 角膜 虹膜 睫状肌 晶状体 脉络膜 巩膜 视网膜 玻璃体 锥状细胞:600万~700万;柱状细胞:7500万~1亿5000万

眼底图

二、视觉的亮度适应性 主观亮度 强闪光阈值 昼视曲线 视觉范围 夜视曲线 光强的对数 夜视阈值 -6 -4 -2 2 4

人眼视觉系统对亮度的响应具有对数性质,是单调的非线性系统。实验证明,这一非线性接近1/3的幂指数函数。人眼通过这一对数性质,达到宽达108的视觉亮度范围。但在固定背景光的条件下,适应范围并不宽。 三、视觉的对比度响应 眼睛对光强的响应是非线性的。一块光强为I+ ∆I的小块被背景强度I 所包围,则可觉察的差值∆I是I的函数,即对视觉敏感的是对比度,而不是亮度值本身。 韦伯定理:如果一个物体的亮度与其周围背景I有刚刚可觉察得到的差别,则它们的比值是I的函数。其在一定的亮度范围内,近似不变,为常数值 0.02,这称为韦伯比。即: ∆I/I=0.02 (常数) I+∆I I

马赫带(Mach Bands)效应和同时对比度效应 一个物体和它周围的亮度的交互作用,产生一种称为马赫带的效应。这个效应说明视觉的明亮程度并不是亮度的单调函数,例如,灰阶条带图象呈现的明亮视觉感觉沿着条带是不均匀的,在条带过渡部分具有负轮廓的边缘,这一效应称之为马赫带效应。 同时对比度效应是指人眼对某个区域对感觉到的亮度并不仅仅依赖于这个区域的强度还与其背景有关。背景亮度大时,这个区域亮度看起来要暗一些;背景亮度暗时,这个区域亮度看起来要亮一些。

四、彩色视觉 彩色的利用不仅令人愉悦,且可获得更多的信息。 实验表明:视觉仅能感知十余级灰阶, 彩色感知但却能区分上千种彩色; 彩色视觉特性是亮度(Brightness)、色调(Hue)和饱和度(Saturation)的函数: 亮度表示感受到的光强度(白色越多,强度越高); 色调表示颜色(各光谱的混合程度); 饱和度是彩色中包含白光的多少(白色越多饱和度越低,纯光谱色是完全饱和的)。

电磁波波长范围很大,使人产生视觉,感到明亮和颜色的电磁波叫可见光。 1、彩色的描述 电磁波波长范围很大,使人产生视觉,感到明亮和颜色的电磁波叫可见光。 可视光区的波长在400nm~700nm,当光谱采样限制到三个人类视觉系统敏感的红、绿、蓝光波段时,对这三个光谱带的光能量进行采样,就可以得到一幅彩色图像。 400nm 700nm 紫外光 红外光 可见光区 546.1nm 435.8nm 780nm

视网膜中叁种视锥体对彩色的吸收曲线

2、彩色的表示 彩色的表示是基于Tomas Young提出的三基色原理: “任何彩色可以用合适的三种基本色混合而再生” 。 生理学已证明,视网膜中有叁种视锥体,具有不同的吸收光谱,SR(λ),SG(λ),SB(λ) 其中:λMIN≤λ≤λMAX 、λMIN ≈400nm、λmax ≈780nm 吸收光谱响应的峰值分别在光谱的红、绿、兰区域。而且,吸收曲线有相当多的部分是相互重叠的。这是三基色原理的生理基础。 三基色相加混色:红、绿、兰三基色(RGB) ; 三基色相减混色:黄、青、品红(CMY)。

设组成某种颜色C所需的三个刺激量分别用R、G、B表示每种刺激量的比例系数为r、g、b,有 1931年CIE根据此原则制定了一个色度图:舌型图(P18)。

3、研究结果: 1)每一点对应一种颜色 2)边界点代表纯颜色 3)任意两点连线表示线上的颜色可由两点颜色混合形成 4)任意三点形成的三角形内的颜色可由三点颜色混合形成

五、彩色模型 三原色:1931年,国际照明委员会(CIE)规定用波长为700nm、546.1nm和435.8nm的单色光作为红(R)、绿(G)、蓝(B)三原色。 任意彩色的颜色方程为: C = rR+gG+bB r、g、b≥0 r、g、b是红、绿、蓝三色的混合比例,一般称为三色系数。 所谓颜色模型指的是某个三维颜色空间中的一个可见光子集。它包含某个色彩域的所有色彩。任何一个色彩域都只是可见光的子集,任何一个三原色颜色模型都无法包含所有的可见光。这一点可从舌型图看出。

NTSC制和PAL制的彩色区别

1、RGB彩色模型 RGB颜色模型是三维直角坐标颜色系统中的一个单位正方体,在正方体的主对角线上,各原色的量相等,产生由暗到亮的白色,即灰度。(0,0,0)为黑,(1,1,1)为白,正方体的其他6个角点分别为红、黄、绿、青、蓝和品红。RGB颜色模型构成的颜色空间是CIE原色空间的一个真子集。RGB颜色模型通常用于彩色阴极射线管和彩色光栅图形显示器。RGB三原色是加性原色。 黄(1,1,0) 黑(0,0,0) 绿(0,1,0) 青(0,1,1) 蓝(0,0,1) 品红(1,0,1) 白(1,1,1) 红(1,0,0)

CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型对应的子空间完全相同。 CMY颜色模型是以红、绿、蓝三色的补色青(Cyan)(白-红)、品红(Magenta)(白- 绿)、黄(Yellow)(白-蓝)为原色构成的颜色模型。CMY颜色模型常用于从白光中滤去某种颜色,故称为减色原色空间。 CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型对应的子空间完全相同。

RGB调色板

CMY调色板

2、HSI彩色模型——双三棱锥模型形(74年) 这种彩色系统格式的设计反映了人类观察彩色的方式。如:红色又分为浅红和深红色等等。 I:双三棱锥中心线;表示光照强度或称为亮度,它确定了像素的整体亮度,而不管其颜色是什么。 H:表示色度,由角度表示。反映了该颜色最接近什么样的光谱波长。0o为红色,120o为绿色,240o为蓝色。0o到240o覆盖了700nm~435.8nm的可见光谱颜色,240o到360o是400nm~ 435.8nm的可见光谱颜色。 S:饱和度,饱和度参数是沿双棱锥中心线垂直方向到彩色点的长度。在双棱锥的外表面是纯的或称饱和的颜色,其饱和度值为1。在中心是中性(灰色)影调,即饱和度为0。

各种亮度下的R、G、B颜色图 各图的色调(各光谱的混合程度)是一样的,由于亮度的不一样使饱和度不一样,导致我们对颜色的感觉是不一样的。

HSI彩色系统的模形描述 黑色 白色 B M=R+B=W-G C=B+G=W-R G R Y=R+G=W-B I S 蓝(0,0,1) 黄(1,1,0) 黑(0,0,0) 绿(0,1,0) 青(0,1,1) 蓝(0,0,1) 品红(1,0,1) 白(1,1,1) 红(1,0,0) B M=R+B=W-G C=B+G=W-R I S H G R Y=R+G=W-B

设P点的坐标为(r,g,b);令从原点(RGB坐标的原点)指向O、P、R的矢量分别为o、p、r。有: 黑(0,0,0) 绿(0,1,0) 蓝(0,0,1) 红(1,0,0) B p-o r-o O (1/3,1/3,1/3) H S P T G R Q Y 设P点的坐标为(r,g,b);令从原点(RGB坐标的原点)指向O、P、R的矢量分别为o、p、r。有:

饱和度S应是PO和QO的比值(达到纯饱和的多少) 色调H是RO、PO的夹角,即: 对应坐标乘积之和 饱和度S应是PO和QO的比值(达到纯饱和的多少) b=1 纯饱和 在三角形ORG中的任意一点都有b≤r、b≤g。 考虑到在三角形OGB和OBR的情况,有 恰好是蓝色成分的系数

六、彩色模型的相互转换 1、 RGB到HSI的转换: 2、HSI到RGB的转换 当0o≤H< 120o时: 当120o ≤H<240o时: 当240o ≤H<360o时:

七、光度学和成像模型 研究光的强弱的学科称为光度学。 1、几个基本概念 发光强度(cd):540×1012Hz单色辐射的点光源沿某方向上的辐射强度为1/683W/sr时,发光强度为1cd。 光通量(lm):按人眼的光感觉来度量的辐射功率。1lm等于发光强度为1cd的点光源,在一球面度立体角内发射的光通量。1lm=1cd*sr 照度(lx):光源对物体辐射的量度。1lx等于1lm光通量均匀分布于1平方米面积上的光照度。1lx=1lm/m2。 亮度(cd/m2):是对所看到的物体表面反射光强的量度。

烛光——Cd:发光强度的单位。1967年第十三届国际计量大会统一规定为:在标准大气压下,处在铂凝固温度(2045K)的绝对黑体的1/600000平方米表面上的发光强度为“1烛光”。 流明——Lm:光通量的单位。发光强度为1烛光的点光源,在单位立体角——1球面度(整个球面的总立体角为4π球面度)内发出的光通量为“1流明”。

勒克斯——Lx:照度的单位。等于1流明的光通量均匀照在1平方米表面上所产生的照度。适宜于阅读和缝纫等的照度约为60勒克司。 照度反比于光源到受照射面的距离的平方,而正比于光束的轴线方向与受照面的法线间夹角的余弦。

2、成像模型 我们所看到的图象都应是亮度分布的函数,由于亮度是一种可以度量的能量,因此一幅图象可以表示成0<f(x,y)<∞。而f(x,y)可以分成两部分组成: 入射光i(x,y) +反射光r(x,y) 即 f(x,y)=i(x,y)r(x,y) 0<i(x,y)<∞ 0<r(x,y)<1 对灰度图象而言,f(x,y)是一灰度值,该值应在一个有限的范围[Lmin,Lmax]: Lmin≤f(x,y)≤Lmax 将f(x,y)=0定义为黑色; f(x,y)=Lmax定义为白色。

研究空间位置座标与成像平面座标之间的关系。 根据相似三角形对应边成比例的关系,有 八、成像变换 研究空间位置座标与成像平面座标之间的关系。 根据相似三角形对应边成比例的关系,有 z,Z x,X o X,Y,Z (x,y) y,Y (0,0,λ) 成像平面 焦距点 为了使其线性化,用齐次座标的方式来表达。

wh=[kx’,ky’,kz,(kz/λ)+k]T 于是 如果图象点的齐次座标为ch=[kx’,ky’,0,k]T,将其代入wh=P-1ch可以得到wh=[kx’,ky’,0,k]T,则 w=[X,Y,Z]T=[x’,y’,0]T ——并不对应空间的某一点。 为了保证逆变换能将图象中的点完全恢复过来,必须加入一些先验知识,如已知Z的座标。 设ch=[kx’,ky’,kz’,k]T将其代入wh=P-1ch可以得到 wh=[kx’,ky’,kz,(kz/λ)+k]T 这样,可以给定一个Z,解出z,从而解出X,Y。

九、采样与量化 对模拟图象的空间座标的离散化——空间采样 对模拟图象的灰度离散化——灰度量化 如果采样、量化间隔相等,则称为均匀采样和均匀量化。 数字图象用一个M×N数组f(x,y)表示: 在数字图象处理中一般将这些量取为2的整数幂: M=2m, N=2n;对灰度量化级G而言,G=2k。

分辨率:(a)127*176 (b)63*88 (c)31*44 (d)15*22 图像尺寸:127*176 分辨率:(a)127*176 (b)63*88 (c)31*44 (d)15*22

关于m、n、k的几个问题 1)、对同一图象而言,从理论上讲,m、n、k越大,分辨率越高,逼真度越好;但所占空间越多。 占用空间的位数为:b=M×N×k 对灰度图象来说,k=8,即256级灰度。 2)、有时固定M×N,k减少反而会使图象看起来更清晰,其主要原因是图象的反差加大,视觉系统对反差更敏感一些。 3)、图象内容的不同,随着m、n、k的加大,对图象的主观评价并不是随着m、n、k的加大而变好。

(1)、4-连接:2个象素p和r在V中取值且r在N4(p) 中。 (2)、8-连接:2个象素p和r在V中取值且r在N8(p) 中。 十、象素之间的关系 1、象素的邻域 r p s 4-邻域N4(p) 对角邻域ND(p) 8-邻域N8(p) 2、连通性 依某种规则表示象素的相邻性(连接性)。 定义:V表示定义连接的灰度值集合。 (1)、4-连接:2个象素p和r在V中取值且r在N4(p) 中。 (2)、8-连接:2个象素p和r在V中取值且r在N8(p) 中。

(3)、m-连接:2个象素p和r在V中取值且满足下列条件之一 —— ① r在N4(p) 中;② r在ND(p)且 N4(p)∩ N4(r)是空集,这个集合是由p,r在V中取值的4-邻域象素组成。 非空不连接 1 如果象素p与象素q相连接,则它们毗邻。根据连接规则,毗邻可分为4-毗邻、8-毗邻、m-毗邻;毗邻象素间形成通路,同样有4-通路、8-通路、m-通路的定义;如果两个象素之间有一个通路,则称两个象素互相连通并形成连通组元。

3、距离量度 如果两个象素是连通的,如何确定它们的距离,不同的方法会有不同的结果。 给定三个象素p、q、r座标分别为(x,y)、(s,t)、(u,v),如果满足下列条件,则D是距离量度函数: 1)、D(p,q)≥0(当且仅当p=q时,D(p,q)=0); 2)、D(p,q)=D(q,p); 3)、D(p,r)≤D(p,q)+D(q,r)。 一般情况下,常用的量度方法有三种: 欧氏距离:DE(p,q)=[(x-s)2+(y,t)2]1/2 城区距离:D4(p,q)=|x-s|+|(y-t)| 棋盘距离:D8(p,q)=max(|x-s|,|(y-t)|)

4、算术和逻辑运算 两个象素间p、q间的逻辑运算包括: 1)、与:记为p AND q 两个象素间p、q间的算术运算包括: 3 2 1 4、算术和逻辑运算 两个象素间p、q间的逻辑运算包括: 1)、与:记为p AND q 2)、或:记为p OR q 3)、非:记为NOT q 4)、异或:记为p XOR q 逻辑运算仅用于二值图象 两个象素间p、q间的算术运算包括: 1)、加法:记为p+q 2)、减法:记为p-q 3)、乘法:记为p*q 4)、除法:记为p/q

图象处理——利用某种方法改变数字图象的象素值 利用象素的邻域进行运算是图象处理中的一种重要方法,可以实现各种滤波。 w9 w8 w7 w6 w5 w4 w3 w2 w1 … z9 z8 z7 z6 z5 z4 z3 z2 z1 例如:考虑用以z5为中心的3×3区域中象素的平均值z来替换z5的值,则有: 如果用3×3模板对其进行运算,有:

例:利用ALU加速模板运算 对一幅512×512的图象完成一次滤波需进行23596次乘法和2097152次加法。利用ALU可加速模板运算。 构造两块图象存贮器A和B;A比B在图象四边各多一个象素。原始图象在A、B中,处理后的图象在B中。 A B

输入原始图象至A、B;在ALU中构造模板系数w1~w9。 1)、B图像中所有像素乘以w5(硬件实现)→B; z5w5 2)、A图像中所有像素右移一个单位(硬件实现) 3)、B+A×w4 →B; z5w5+z4w4 4)、A图像中所有像素下移一个单位 5)、B+A×w1 →B; z5w5+z4w4 +z1w1 6)、A图像中所有像素左移一个单位 7)、B+A×w2 →B; z5w5+z4w4 +z1w1 +z2w2 8)、A图像中所有像素左移一个单位 9)、B+A×w3 →B; z5w5+z4w4+z1w1+z2w2+z3w3 10)、A图像中所有像素上移一个单位 11)、B+A×w6 →B; z5w5+z4w4+z1w1+z2w2+z3w3+z6w6 12)、A图像中所有像素上移一个单位 13)、B+A×w9 →B; z5w5+z4w4+z1w1+z2w2+z3w3 +z6w6 +z9w9

14)、A图像中所有像素上移一个单位 15)、B+A×w8 →B z5w5+z4w4+z1w1+z2w2+z3w3+z6w6+z9w9+z8w8 16)、A图像中所有像素右移一个单位 17)、B+A×w7 →B z5w5+z4w4+z1w1+z2w2+z3w3+z6w6+z9w9+z8w8+z7w7 18)、A图像中所有像素左移一个单位 19)、A图像中所有像素下移一个单位,A图像回原位。 B图像中一点完成后,各点的计算也同时完成。所需时间仅为9次乘法、8次加法、10次移位的时间

空间点的任何一种运动都可以由以下几种变换组合而成。 1)、平移变换A 2)、尺度变换S 十一、坐标变换与变换的级连 空间点的任何一种运动都可以由以下几种变换组合而成。 1)、平移变换A 2)、尺度变换S x y z α β γ 3)、旋转变换R 任何一个旋转都可以分解成分别绕x、y、z三轴的旋转。

级连与反变换 空间中任何一点坐标都可以经过对应的变换得到该点在新位置的坐标。如果这种变换不是单一的,则各变换的组合就是变换阵的级连。 设:某空间点坐标为v=(x,y,z)T,则变换后的新坐标为:v’=(x’,y’,z’)T其变换阵为各变换阵的级连阵A。 例: vh’=Rγ[S(Tvh)]=Avh vh=A-1 vh’ v’=(x’,y’,z’)T——用vh的第四个参数分别除前三个参数。 变换后的坐标经透视变换后就是新位置点坐标在图像上的投影的齐次坐标表示。 ch= Pv’=PAvh = Rγ[S(Tvh)] 在图像上的投影的坐标为用ch的第四个参数分别除前三个参数且将第三个参数置为零。

附:图像文件结构——.BMP文件格式 1、什么是BMP文件格式——对每个像素逐个编码 Windows操作系统的标准文件格式 ——非压缩格式 2、BMP文件结构 BMP文件由四部分组成:位图文件头、位图信息头、调色板和图像数据。 实际上,任何一种图像格式都有类似的结构,只不过名称不同、数据格式不同。如TIF、PCX等格式。

4个字节一组,B,G, R相对亮度各一个字节+一个保留字节0 2,16,256,0项 文件映射 地址 长度 名称 内容 说明 位图 文件头 2byte bfType 42H,4DH-’BM’ 文件标记 2 4byte bfSize 文件大小 DIR显示值 6 bfReserved 保留字 内容为0 0AH bfoffBits 位图阵列起始偏移量 随格式变化 信息头 0EH biSize 位图信息头长度 40字节(28H) 12H biWidth 位图的宽度(像素单位) 随大小变化 16H biHeight 位图的高度(像素单位) 1AH biPlane 位图的色面数 总为 1 1CH biBitCount 每像素所需的位数 1、4、8、24 1EH biCompression 压缩类型 0-不压缩 1,2,3-压缩 22H biSizeImage 位图大小(图像数据) 为4的倍数 26H biXPelsPerMeter 目标设备水平分辨率 像素/米 2AH biYPelsPerMeter 目标设备垂直分辨率 2EH biClrUsed 颜色实际使用数 总为 0 32H biClrImportant 重要颜色数 0-同等重要 调色板 4个字节一组,B,G, R相对亮度各一个字节+一个保留字节0 2,16,256,0项 图像数据 从bfoffBits指定位置开始;由图像的左下角开始排列信息 顺序排列

3、图像的.BMP文件格式举例 一个单色16×16全白图像的.BMP文件格式 white.bmp 1099:0100 42 4D 7E 00 00 00 00 00-00 00 3E 00 00 00 28 00 1099:0110 00 00 10 00 00 00 10 00-00 00 01 00 00 01 00 00 1099:0120 00 00 40 00 00 00 C4 0E-00 00 C4 0E 00 00 00 00 1099:0130 00 00 00 00 00 00 00 00-00 00 FF FF FF 00 FF FF 1099:0140 00 00 FF FF 00 00 FF FF-00 00 FF FF 00 00 FF FF 1099:0150 00 00 FF FF 00 00 FF FF-00 00 FF FF 00 00 FF FF 1099:0160 00 00 FF FF 00 00 FF FF-00 00 FF FF 00 00 FF FF 1099:0170 00 00 FF FF 00 00 FF FF-00 00 FF FF 00 00 1E 3C 逐位对应 两种颜色,编号0,1 选第二种颜色每位一象素

white.bmp图像的行数据表示 与此类推 8×8 FF 00 00 00 16×16 FF FF 00 00 32×32 FF FF FF FF 33×33 FF FF FF FF 80 00 00 00 64×64 FF FF FF FF FF FF FF FF 65×65 FF FF FF FF FF FF FF FF 80 00 00 00 96×96 FF FF FF FF FF FF FF FF FF FF FF FF 97×97 FF FF FF FF FF FF FF FF FF FF FF FF 80 00 00 00 … … … … 与此类推 补32位

一个单色16×16全黑图像的.BMP文件格式 black.bmp 1099:0100 42 4D 7E 00 00 00 00 00-00 00 3E 00 00 00 28 00 1099:0110 00 00 10 00 00 00 10 00-00 00 01 00 01 00 00 00 1099:0120 00 00 40 00 00 00 C4 0E-00 00 C4 0E 00 00 00 00 1099:0130 00 00 00 00 00 00 00 00-00 00 FF FF FF 00 00 00 1099:0140 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 1099:0150 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 1099:0160 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 1099:0170 00 00 00 00 00 00 00 00-00 00 00 00 00 00 1E 3C 选第一种颜色每位一象素 两种颜色,编号0,1

一个16色的16×16全灰图像的.BMP文件格式 16种颜色编号 0~F 选第八种颜色每4位一象素 c16-gray.bmp 1099:0100 42 4D F6 00 00 00 00 00-00 00 76 00 00 00 28 00 1099:0110 00 00 10 00 00 00 10 00-00 00 01 00 04 00 00 00 1099:0120 00 00 80 00 00 00 C4 0E-00 00 C4 0E 00 00 00 00 1099:0130 00 00 00 00 00 00 00 00-00 00 00 00 80 00 00 80 1099:0140 00 00 00 80 80 00 80 00-00 00 80 00 80 00 80 80 1099:0150 00 00 80 80 80 00 C0 C0-C0 00 00 00 FF 00 00 FF 1099:0160 00 00 00 FF FF 00 FF 00-00 00 FF 00 FF 00 FF FF 1099:0170 00 00 FF FF FF 00 88 88-88 88 88 88 88 88 88 88 1099:0180 88 88 88 88 88 88 88 88-88 88 88 88 88 88 88 88 1099:0190 88 88 88 88 88 88 88 88-88 88 88 88 88 88 88 88 1099:01A0 88 88 88 88 88 88 88 88-88 88 88 88 88 88 88 88 1099:01B0 88 88 88 88 88 88 88 88-88 88 88 88 88 88 88 88 1099:01C0 88 88 88 88 88 88 88 88-88 88 88 88 88 88 88 88 1099:01D0 88 88 88 88 88 88 88 88-88 88 88 88 88 88 88 88 1099:01E0 88 88 88 88 88 88 88 88-88 88 88 88 88 88 88 88 1099:01F0 88 88 88 88 88 88 0E 74-06 F6 44 07 0C 75 08 C4 16种颜色编号 0~F 选第八种颜色每4位一象素

一个16色的16×16全黄图像的.BMP文件格式 16种颜色编号 0~F 选第12种颜色每4位一象素 c16-y.bmp 1099:0100 42 4D F6 00 00 00 00 00-00 00 76 00 00 00 28 00 1099:0110 00 00 10 00 00 00 10 00-00 00 01 00 04 00 00 00 1099:0120 00 00 80 00 00 00 C4 0E-00 00 C4 0E 00 00 00 00 1099:0130 00 00 00 00 00 00 00 00-00 00 00 00 80 00 00 80 1099:0140 00 00 00 80 80 00 80 00-00 00 80 00 80 00 80 80 1099:0150 00 00 80 80 80 00 C0 C0-C0 00 00 00 FF 00 00 FF 1099:0160 00 00 00 FF FF 00 FF 00-00 00 FF 00 FF 00 FF FF 1099:0170 00 00 FF FF FF 00 BB BB-BB BB BB BB BB BB BB BB 1099:0180 BB BB BB BB BB BB BB BB-BB BB BB BB BB BB BB BB 1099:0190 BB BB BB BB BB BB BB BB-BB BB BB BB BB BB BB BB 1099:01A0 BB BB BB BB BB BB BB BB-BB BB BB BB BB BB BB BB 1099:01B0 BB BB BB BB BB BB BB BB-BB BB BB BB BB BB BB BB 1099:01C0 BB BB BB BB BB BB BB BB-BB BB BB BB BB BB BB BB 1099:01D0 BB BB BB BB BB BB BB BB-BB BB BB BB BB BB BB BB 1099:01E0 BB BB BB BB BB BB BB BB-BB BB BB BB BB BB BB BB 1099:01F0 BB BB BB BB BB BB 0E 74-06 F6 44 07 0C 75 08 C4 选第12种颜色每4位一象素

一个256色的16×16全灰图像的.BMP文件格式 256种颜色编号 0~FF 选第七种颜色每8位一象素 c256-g.bmp 1099:0100 42 4D 36 05 00 00 00 00-00 00 36 04 00 00 28 00 1099:0110 00 00 10 00 00 00 10 00-00 00 01 00 08 00 00 00 1099:0120 00 00 00 01 00 00 C4 0E-00 00 C4 0E 00 00 00 00 1099:0130 00 00 00 00 00 00 00 00-00 00 00 00 80 00 00 80 1099:0140 00 00 00 80 80 00 80 00-00 00 80 00 80 00 80 80 1099:0150 00 00 C0 C0 C0 00 C0 DC-C0 00 F0 CA A6 00 00 20 1099:0160 40 00 00 20 60 00 00 20-80 00 00 20 A0 00 00 20 ……………………………….. 1099:0530 00 00 FF FF FF 00 07 07-07 07 07 07 07 07 07 07 1099:0540 07 07 07 07 07 07 07 07-07 07 07 07 07 07 07 07 1099:0550 07 07 07 07 07 07 07 07-07 07 07 07 07 07 07 07 1099:0560 07 07 07 07 07 07 07 07-07 07 07 07 07 07 07 07 1099:0620 07 07 07 07 07 07 07 07-07 07 07 07 07 07 07 07 1099:0630 07 07 07 07 07 07 00 05-00 B0 00 06 00 C8 00 07 选第七种颜色每8位一象素

一个256色的16×16全黄图像的.BMP文件格式 256种颜色编号 0~FF 选第252种颜色每8位一象素 c256-y.bmp 1099:0100 42 4D 36 05 00 00 00 00-00 00 36 04 00 00 28 00 1099:0110 00 00 10 00 00 00 10 00-00 00 01 00 08 00 00 00 1099:0120 00 00 00 01 00 00 C4 0E-00 00 C4 0E 00 00 00 00 1099:0130 00 00 00 00 00 00 00 00-00 00 00 00 80 00 00 80 1099:0140 00 00 00 80 80 00 80 00-00 00 80 00 80 00 80 80 1099:0150 00 00 C0 C0 C0 00 C0 DC-C0 00 F0 CA A6 00 00 20 1099:0160 40 00 00 20 60 00 00 20-80 00 00 20 A0 00 00 20 1099:0170 C0 00 00 20 E0 00 00 40-00 00 00 40 20 00 00 40 ……………………………….. 1099:0520 00 00 00 FF FF 00 FF 00-00 00 FF 00 FF 00 FF FF 1099:0530 00 00 FF FF FF 00 FB FB-FB FB FB FB FB FB FB FB 1099:0540 FB FB FB FB FB FB FB FB-FB FB FB FB FB FB FB FB 1099:0550 FB FB FB FB FB FB FB FB-FB FB FB FB FB FB FB FB 1099:0620 FB FB FB FB FB FB FB FB-FB FB FB FB FB FB FB FB 1099:0630 FB FB FB FB FB FB 00 05-00 B0 00 06 00 C8 00 07 256种颜色编号 0~FF 选第252种颜色每8位一象素

由于绝大多数图像格式可以转换成.BMP格式,因此,图像的计算机处理(计算、存贮、显示)的问题已基本解决。 c24b-g.bmp 1099:0100 42 4D 36 03 00 00 00 00-00 00 36 00 00 00 28 00 1099:0110 00 00 10 00 00 00 10 00-00 00 01 00 18 00 00 00 1099:0120 00 00 00 03 00 00 C4 0E-00 00 C4 0E 00 00 00 00 1099:0130 00 00 00 00 00 00 C0 C0-C0 C0 C0 C0 C0 C0 C0 C0 1099:0140 C0 C0 C0 C0 C0 C0 C0 C0- C0 C0 C0 C0 C0 C0 C0 C0 1099:0150 C0 C0 C0 C0 C0 C0 C0 C0 C0 C0 C0 C0 C0 C0 C0 C0 ………………………………………………….. 1099:0400 C0 C0 C0 C0 C0 C0 C0 C0-C0 C0 C0 C0 C0 C0 C0 C0 1099:0410 C0 C0 C0 C0 C0 C0 C0 C0-C0 C0 C0 C0 C0 C0 C0 C0 1099:0420 C0 C0 C0 C0 C0 C0 C0 C0-C0 C0 C0 C0 C0 C0 C0 C0 1099:0430 C0 C0 C0 C0 C0 C0 8F 06-95 2C FE CA 75 F8 E8 02 每24位一象素 由于绝大多数图像格式可以转换成.BMP格式,因此,图像的计算机处理(计算、存贮、显示)的问题已基本解决。

作业1 构造100×100的黑白图像的.BMP文件(50行黑,50行白)。 构造100×100的256色图像的.BMP文件(每行颜色不同)。 构造100×100的24位真彩图像的.BMP文件(每行颜色不同)。 使用语言:任选。建议使用VC。 如果使用汇编语言,则建议使用Tasm。 汇编:tasm /zi example(或使用masm后再使用tasm) 连接:tlink /v example 调试:td example.exe 注意汇编程序中的段设置问题。

作业2 编制将一幅RGB图像转换为HIS模型后生成的H、 S 、I的RGB图像的软件并用Photoshop观察。 检测方法:当对原RGB图像进行增亮处理后,发生变化的图像只有I(I图像中没有彩色信息)、S图像,H图像应保持不变。 可用Photoshop检验。 作业3 2.7、2.8、2.9、2.13、2.14、2.15、2.16

在图像转换的实际应用中各参量的计算如下: 以Photoshop为例

生成HIS的RGB显示图像的具体做法 I:将该点R、B、G三值中最大的值作为I图像的R、G、B值。 H:将该点R、B、G三值同时减1直至其中的某一值减至1时为止,其结果作为H图像的R、G、B值 S:若该点R、B、G三值相等,则将三值置为0,作为S图像的R、G、B值。 若该点R、B、G三值有一个为0,则将其余两项分别被较小的一项除;若该点R、B、G三值有二个为0,则将剩余项置为1;其结果作为S图像的R、G、B值。 若该点R、B、G三值不等,则将三项分别被较小的一项除,其结果作为S图像的R、G、B值。