第2章图像的基本知识及运算 专业术语及表示方法 图像与视觉之间的关系 图像象素间的关系 图像间的运算
专业术语 数字图像与物理图像-数字图像是离散的,物理图像是连续的函数
数字化-为了适应数字计算机的处理,必须对连续图像函数进行空间和幅值数字化。空间坐标(x,y)的数字化称为图像采样,而幅值数字化被称为灰度级量化。经过数字化后的图像称为数字图像(或离散图像)。
采样-就是图像在空间上的离散化处理,即使空间上连续变化的图像离散化
量化-经过取样的图像,只是在空间上被离散为像素(样本)的阵列,而每一个样本灰度值还是一个有无穷多个取值的连续变化量,必须将其转化为有限个离散值,赋于不同码字才能真正成为数字图像,再由数字计算机或其它数字设备进行处理运算,这样的转化过程称其为量化
灰度分辨率是指值的单位幅度上包含的灰度级数,即在灰度级数中可分辨的最小变化。若用8比特来存储一幅数字图像,其灰度级为256。 对比度-指一幅图像中灰度反差的大小,对比度=最大亮度/最小亮度 分辨率 -空间分辨率和灰度分辨率 灰度分辨率是指值的单位幅度上包含的灰度级数,即在灰度级数中可分辨的最小变化。若用8比特来存储一幅数字图像,其灰度级为256。 空间分辨率是指图像中可辨别的最小细节,采样间隔决定空间分辨率的主要参数。一般情况下,如果没有必要实际度量所涉及象素的物理分辨率和在原始场景中分析细节等级时,通常将图像大小M×N,灰度为L级的数字图像称为空间分辨率为M×N,灰度级分辨率为L级的图像。
图像噪声-妨碍人们感觉器官对所接收的信息理解的因素 ,种类很多,如加性噪声、乘性噪声、白噪声和高斯噪声
采样点和量化级的选取 假定一幅图像取M×N个样点,对样点值进行Q 级分档取整。那么对 M、N和Q如何取值呢? 为了存取的方便,Q一般总是取成2的整数次幂 ,如Q=2b,b为正整数,通常称为对图像进行b比特量化。 对b来讲,取值越大,重建图像失真越小
对M×N的取值,主要的依据是取样的约束条件,也就是在M×N达到满足取样定理的情况下,重建图像就不会产生失真,否则就会因取样点数不够而产生所谓混淆失真
数字图像的表示 象素(pixel) 灰度图像表示
灰度图象(128x128)及其对应的数值矩阵(仅列出一部分(26x31))
彩色图像表示-彩色图象可以用红、绿、蓝三元组的二维矩阵来表示。 通常,三元组的每个数值也是在0到255之间,0表示相应的基色在该象素中没有,而255则代表相应的基色在该象素中取得最大值,这种情况下每个象素可用三个字节来表示
彩色图象(128x128)及其对应的数值矩阵(仅列出一部分(25x31))
二值图像表示 为了减少计算量,常将灰度图像转为二值图像处理。 定义:只有黑白两个灰度级,即象素灰度级非1即0,如文字图片,其数字图像可用每个象素1bit的矩阵表示 二值图像的特殊表示法:如链码(Freeman码)-适合表示直线和曲线组成的二值图像,以及描述图像的边界轮廓 采用链码节省很多的比特数-规定了链的起点坐标和链的斜率序列,这样就可以完全描述曲线和直线
八向链码
图像信息的基本知识 图像与视觉之间的关系 图像象素之间联系 图像之间的运算
人眼与亮度视觉 镜头 成像面 15m 100m 17mm 人眼截面示意图 x/17=15/100x=2.55mm 晶状体 视网膜 人眼的亮度适应范围 量级 同时亮度适应区间不大, 一般 < 64级 x/17=15/100x=2.55mm
亮度适应 假设一个平面如磨砂玻璃一样散光,被1个强度为I且可以变化的光源从背后照亮,1个照度增量为△I,像短促闪光一样加在均匀照明的平面上,可使人感到平面中间像1个圆形亮点,如图所示 如果△I不够亮,实验者没有感知上的变化,当△I逐步增强,感知上发生变化。如果50%的机会感知亮度变化,则量△I50/I为韦伯率,小的韦伯率表示可区分强度的小变化,有较好的亮度区分能力;大的韦伯率表示只有大的强度变化才能区分,有较差的亮度区分能力
同时对比度 马赫带效应 视觉系统有趋向于过高或过低估计不同亮度区域边界值的现象 亮背景下显得暗、暗背景下显得亮 每个条带内部的亮度是常数,但仍然有强烈的边缘效应 同时对比度 亮背景下显得暗、暗背景下显得亮 它是基于人眼对某个区域感觉到的亮度并不仅仅依赖于它的强度
颜色视觉 R 波长700 nm 颜色分解 G 波长546.1 nm B 波长435.8 nm 三基色 亮度(Intensity) 色调(Hue) 饱和度(Saturation) 区分颜色的3种基本特性 色度 与混合光谱中主要光波长相联系 对彩色图像来说,颜色中掺入白色越多,就越亮,掺入黑色越多灰度就越小 与一定色调的纯度有关,纯光谱是完全饱和的,随着白光的加入,饱和度逐渐减少
颜色模型 RGB CMY YUV YCrCb HSV
RGB彩色空间 RGB颜色模型主要应用于CRT监视器和图形刷新设备中。尽管该彩色空间是最普遍的,但是由于R、G、B三色之间存在强烈的相关性
CMY彩色空间 CMY-在印刷行业 , CMY分别是青色(Cyan)、品红(Magenta)、黄色(Yellow)三种油墨色 CMY颜色模型与RGB颜色模型几乎完全相同。差别仅仅在于前者的原点为白,而后者的原点为黑。前者是定义在白色中减去某种颜色来定义一种颜色,而后者是通过从黑色中加入颜色来定义一种颜色。
HSV彩色空间
该模型经常为艺术家所使用。这种格式反映了人类观察色彩的方式,同时也有利于图像处理 亮度(V)与反映色彩本质特性的两个参数-色度(H)和饱和度(S)――分开 优点 光照明暗给物体颜色带来的直接影响就是亮度分量(V),所以若能将亮度分量从色彩中提取出去,而只用反映色彩本质特性的色度、饱和度来进行聚类分析,会获得比较好的效果。这也正是HSV模型在彩色图像处理和计算机视觉的研究中经常被使用的原因
与RGB之间关系
YUV彩色空间 一种彩色传输模型,主要用于彩色电视信号传输标准 Y-黑白亮度分量,U,V-彩色信息用以显示彩色图像 与RGB之间的转换关系:
应用于电视显示,视频压缩,MPGE/JPEG YCrCb彩色空间 一种彩色传输模型 ,主要用于彩色电视信号传输标准方面,被广泛的应用在电视的色彩显示等领域中 应用于电视显示,视频压缩,MPGE/JPEG 人类视觉感知过程相类似 将色彩中的亮度分量分离 优点 计算过程和空间坐标形式简单
与RGB之间关系
图像象素间的联系 主要介绍数字图像中基本而又重要的象素间的关系 表示一幅图像 p和q 表示图像中某个特定的象素
象素的邻域 4-邻域和8-邻域 4-邻域 4-对角邻域 8-邻域
连通性 为了确定目标的边界和区域的元素 分为连接和连通,连接是连通的一个特例 V-定义为连接的灰度值集合 如在一幅二值图中,为考虑灰度值为1的象素之间的连通性,V={1}。又知在l幅灰度图中,考虑具有灰度值在8到16之间象素的连通性,则V={8,9,…,15,16}。 0 1 1 0 1 0 0 0 1 V={1}
(1)4-连接: 2个象素p和r在V中取值且r在 中,则它们为4-连接; 定义3种情况的连接 (1)4-连接: 2个象素p和r在V中取值且r在 中,则它们为4-连接; (2)8-连接: 2个象素p和r在V中取值且r在 中,则它们为8-连接; (3)m-连接(混合连接): 2个象素p 和r在V中取值且满足下列条件之一,则它们为m-连接: ① r在 中; ② 是空集,这个集合是由p和r的在V中取值的4-近邻象素组成的。 为了消除8-连接时的多路连接 0 1 1 0 1 0 0 0 1 m-连接 m-不连接 0 1 1 0 1 0 0 0 1 8-连接 2条连线
路径 临近-如果1个象素p和1个象素q是连通的,则称象素p临近于q 路径-如果一条从具有坐标(x,y)的象素p,到具有坐标(s,t)的象素q的路径,是指具有坐标(x0,y0),(x1,y1),…,(xn,yn)的不同象素的序列。其中(x0,y0)=(x,y),(xn,yn)=(s,t),(xi,yi)临近于(xi-1,yi-1),1≤i≤n,n是路径的长度
连通体算法 在二值图像中标注值为1的4-连通元素为例来说明自动标注连通元素的算法 1、申请一片标注空间 2、对图像中的任意象素p,其上面的象素为t,左边的象素为r,从左向右扫描图像,有4中情况,如图所示: A:如r和t的值为0,给p一个新标记; B:如r或t有一个为1,将为1的标记给p; C:如r和t都是1,并且有相同标记,赋该标记到p; D:如r和t都是1,并且有不同的标记,赋这两个标记中的一个给p,并且建立一个说明,指出那两个标记是等价的。
3、在扫描结束时,所有具有1值的点都被打上标记,但这些标记中的一些也许是等价的,现在需要做的是整理所有的等价对成为等价类,然后给每一个类一个标记,第二次扫描图像,用所赋予的等价类的标记替换不同的标记。
象素间的距离测量 给定3个象素p, q, r, 坐标分别为 , , ,如果下列条件满足的话,D是距离量度函数: (1) ( 当且仅当 ); (1) ( 当且仅当 ); (2) ; (3) 。 点p和q之间的Euclidean距离定义为 小于等于某个值d的距离,以(x,y)为中心,以d为半径的圆中 点p和q之间的 距离,即城市(city-block)距离,定义为: 小于等于某个值d的距离,以(x,y)为中心的菱形
点p和q之间的 距离,即棋盘(chessboard)距离,定义为: 小于等于某个值d的距离,以(x,y)为中心的正方形 两点p和q之间的 距离等于它们之间最短的4-通路的长度, 距离也有类似性质。实际上我们考虑2点p和q之间的 距离和 距离时并不需要看它们之间是否真有1条通路,因为这些距离的定义只涉及这些点的坐标。但对m-连通,2点之间的距离值(通路的长度)依赖于沿通路的象素和它们近邻象素的值。
图像之间的运算 代数运算 几何运算
代数运算 可以将两幅待处理的图像f(x,y)和g(x,y)以矩阵的形式表达 代数运算是指对图像象素几何不变化,图像灰度级的加、减、乘和除运算。也就是对两幅输入图像进行点对点的加、减、乘和除计算而得到输出图像的运算 可以将两幅待处理的图像f(x,y)和g(x,y)以矩阵的形式表达
M、N分别代表图像的行列数。这样,对于尺寸相同的两幅图像,其间的加、减、乘和除运算可分别表达为 既可为常数,也可为变量。
应用 理想图像 噪声 加运算应用-求平均降噪声 假设我们有M帧待分析的图像序列,则第k帧图像表示为 假设噪声图像为零均值以及各帧独立
定义功率信噪比为 对M帧图像进行平均,则有 则输出图像的信噪比为
减运算应用-序列图像求运动目标
几何运算 通过图像象素位置的变换,运算后,直接确定该象素灰度的运算。与代数运算不同,几何运算可改变图像中各物体之间的空间关系 可看成是将各物体在图像内移动。一个几何运算需要两个独立的算法。 空间变换,用它来描述每个象素如何从其初始位置“移动”到终止位置; 灰度级插值的算法,这是因为,在一般情况下,输入图像的位置坐标(x,y)为整数,而输出图像的位置坐标为非整数。
空间变换 要求保持图像中曲线型特征的连续性和各物体的连通性,一个约束较少的空间变换算法很可能会弄断直线和打碎图像,从而使图像的内容“支离破碎”。 一般用数学方法来描述输入、输出图像点之间的空间关系。几何运算的一般定义为:
灰度级插值 在输入图像f(x,y)中,灰度值仅仅在整数位置(x,y)处被定义,然而在上式中,g(x,y)的灰度值一般由处在非整数坐标上的f(x,y)的值来确定。所以,如果把几何运算看成是一个从f到g的映射,则f中的一个象素会映射到g中的几个象素之间的位置 最简单的方法-最近邻法 一般采样双线性插值
双线性插值 令f(x,y)为两个变量的函数,其在单位正方形顶点的值已知,假设我们希望通过插值得到正方形内任意点的f(x,y)的灰度值,则可由双曲线方程 从a到d这四个系数需由已知的四个顶点的f(x,y)灰度值拟合 x y 1 2 3
步骤1-对上端的两个顶点进行线性插值,可得: 步骤2-对底端的两个顶点进行线性插值,可得 步骤3-进行垂直方向的线性插值 合并 x y 1 2 3 步骤1-对上端的两个顶点进行线性插值,可得: 步骤2-对底端的两个顶点进行线性插值,可得 步骤3-进行垂直方向的线性插值 合并
基本的几何运算 平移 放大、缩小 旋转
平移 变换公式 y x
放大、缩小 使图像在x轴方向放大(缩小)c倍,在y轴方向上放大(缩小)d倍 由于放大(缩小)算子运算不是一一映射,只是简单的重复放大,因此将产生所谓的“方块”效应,为改善这种可视效果,需要进行插值运算
旋转 变换公式-对图像绕原点顺时针θ角旋转变换 x ’ x y’ y X Y
应用 消除由摄像机原因导致的数字图像几何畸变;
对相似图像进行配准,以便进行图像比较 医学图像融合