第4讲 课 题: 1. 图像数字化概念、数字化参数对图像质量的影响、 数字化器性能评价。2. 图像灰度直方图的基本概念、计算、 性质及其应用。 3.数字图像处理算法形式与数据结构。 4.图像图像文件格式与特征 目的要求:1. 熟悉本章基本概念和图像处理算法形式,了解图像的特征; 2.重点掌握图像数字化图像灰度直方图的基本概念及应用、图像数据结构与特征。 重 点:图像数字化、图像灰度直方图和图像文件BMP格式 难 点:图像数字化、直方图应用、图像分层结构数据 教学课时:2课时 教学方法:授课为主、鼓励课堂交流 本次课涉及的学术前沿:数字图像处理的原理及方法
1 成象模型 3-D客观场景到2-D成像平面的中心投影。物方点空间坐标与对应的像方点坐标满足几何透视变换关系(共线条件)。 f(x,y)---理想成像面坐标点(x,y) 的亮度 i(x,y)---照度分量 r(x,y)---反射分量,则 f(x,y)=i(x,y)×r(x,y) 其中 :0< i(x,y)< ∞ , 0 <r(x,y)<1
2图像数字化 图像数字化是将一幅画面转化成计算机能处理的形式——数字图像的过程。 模拟图像 数字图像 正方形点阵 模拟图像 数字图像 正方形点阵 具体来说,就是把一幅图画分割成如图2.3.1所示 的一个个小区域(像元或像素),并将各小区域 灰度用整数来表示,形成一幅点阵式的数字图像。它包括采样和量化两个过程。像素的位置和灰度就是像素的属性。
将空间上连续的图像变换成离散点的操作称为采样。采样间隔和采样孔径的大小是两个很重要的参数。 2.1采样 将空间上连续的图像变换成离散点的操作称为采样。采样间隔和采样孔径的大小是两个很重要的参数。 当对图像进行实际的抽样时,怎样选择各抽样点的间隔是个非常重要的问题。关于这一点,图像包含何种程度的细微的浓淡变化,取决于希望忠实反映图像的程度。 不同形状的采样孔径
经采样图像被分割成空间上离散的像素,但其灰度是连续的,还不能用计算机进行处理。 采样方式:有缝、无缝和重迭 2.2量化 经采样图像被分割成空间上离散的像素,但其灰度是连续的,还不能用计算机进行处理。 将像素灰度转换成离散的整数值的过程叫量化。 表示像素明暗程度的整数称为像素的灰度级(或灰度值或灰度)。 一幅数字图像中不同灰度级的个数称为灰度级数,用G表示。
灰度级数就代表一幅数字图像的层次。图像数据的实际层次越多视觉效果就越好。 一般来说, ,g就是表示存储图像像素灰度值所需的比特位数。 若一幅数字图像的量化灰度级数G=256=28级,灰度取值范围一般是0~255的整数,由于用8bit就能表示灰度图像像素的灰度值,因此常称8 bit 量化。 从视觉效果来看,采用大于或等于6比特位量化的灰度图像,视觉上就能令人满意。 一幅大小为M×N、灰度级数为G的图像所需的存储空间,即图像的数据量,大小为 M×N×g (bit)
图像的每个像素只能是黑或白,没有中间的过渡,故又称为二值图像。二值图像的像素值为0或1。 数字图像根据灰度级数的差异可分为:黑白图像、灰度图像和彩色图像。 黑白图像 图像的每个像素只能是黑或白,没有中间的过渡,故又称为二值图像。二值图像的像素值为0或1。 例如
彩色图像是指每个像素由R、G、B分量构成的图像,其中R、B、G是由不同的灰度级来描述。 灰度图像 灰度图像是指灰度级数大于2的图像。但它不包含彩色信息。 彩色图像 彩色图像是指每个像素由R、G、B分量构成的图像,其中R、B、G是由不同的灰度级来描述。
数字化方式可分为均匀采样、量化和非均匀采样、量化。 2.3 量化参数与数字化图像间的关系 数字化方式可分为均匀采样、量化和非均匀采样、量化。 所谓“均匀”,指的是采样、量化为等间隔方式。图像数字化一般采用均匀采样和均匀量化方式。 非均匀采样是根据图象细节的丰富程度改变采样间距。细节丰富的地方,采样间距小,否则间距大。 非均匀量化是对图像层次少的区域采用间隔大量化,而对图像层次丰富的区域采用间隔小量化。 采用非均匀采样与量化,均会使问题复杂化,因此很少采用。
图像的质量 1.平均亮度 2.对比度 是指一幅图象中灰度反差的大小。 对比度=最大亮度/最小亮度
3.清晰度 由图像边缘灰度变化的速度来描述。 4.分解力或分辨率
一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现像素呈块状的国际棋盘效应; 采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。
量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大; 量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小。 但在极少数情况下对固定图像大小时,减少灰度级能改善质量,产生这种情况的最可能原因是减少灰度级一般会增加图像的对比度。例如对细节比较丰富的图像数字化。
数字化器必须能够将图像划分为若干像素并分别给它们地址,能够度量每一像素的灰度并量化为整数,能够将这些整数写入存储设备。 2. 4 数字化器 数字化器必须能够将图像划分为若干像素并分别给它们地址,能够度量每一像素的灰度并量化为整数,能够将这些整数写入存储设备。 一、数字化器组成 A.采样孔:保证单独观测特定的像素而不受其它部分的影响。 B.图像扫描机构:使采样孔按预先确定的方式在图像上移动。 C.光传感器:通过采样孔测量图像的每一个像素的亮度。 D.量化器:将传感器输出的连续量转化为整数值。 E.输出存储体:将像素灰度值存储起来。它可以是固态存储器,或磁盘等。 常用的数字化器是扫描仪、数码相机和数码摄像机。
二、扫描仪工作原理 扫描仪是图像输入的常用设备。其工作步骤是: 1.将欲扫描的原稿正面朝下铺在扫描仪的玻璃板上; 2.启动扫描仪驱动程序后,安装在扫描仪内部的可移动光源 通过机械传动机构在控制电路的控制下带动装着光学系统和CCD的扫描头与图稿进行相对运动来完成扫描。 3.照射到原稿上的光线经反射后穿过一个很窄的缝隙,形成横向光带,又经过一组反光镜,由光学透镜聚焦并进入分光镜,经过棱镜和红绿蓝三色滤色镜得到的RGB三条彩色光带,分别照到各自的CCD上,CCD将RGB光带转变为模拟电子信号,该信号又被A/D变换器转变为数字 电子信号。 4.将数字电子信号传送 至计算机存储起来。
扫描仪的类型有很多种,按扫描仪所扫描对象来划分,可分为反射式和透射式两种。根据其组成结构,扫描仪可分为手持式、平板式和滚筒式等几种。 手持式扫描仪 这种扫描仪诞生于1987年,是当年使用比较广泛的扫描仪品种,最大扫描宽度为105mm,用手推动,完成扫描工作,也有个别产品采用电动方式在纸面上移动,称为自走式扫描仪。 手持式扫描仪扫描幅面太窄,难于操作和捕获精确图像,扫描效果也很差。1995 ~1996年,各扫描仪厂家相继停止生产这一产品,手持式扫描仪退出了历史的舞台
鼓式扫描仪 又称为滚筒式扫描仪。鼓式扫描仪是专业印刷排版领域应用最广泛的产品。 滚筒式扫描仪的结构特殊,它的工作原理是把原图贴放在一个有机玻璃滚筒上,让滚筒以一定的速率围绕一个光电系统旋转,探头中的亮光源发射出的光线通过细小的锥形光圈照射在原图上,一个像素一个像素地进行采样。 这种扫描仪的光学分辨率高、色深高、动态范围宽,而且输出的图像普遍具有色彩还原逼真、阴影区细节丰富、放大效果优良等特点。但它的体积大,价格也很高。
平台式扫描仪 又称平板式扫描仪、台式扫描仪,这种扫描仪诞生于1984年,是目前扫描仪的主流产品。 它的扫描区域为一块透明的平板玻璃,将原图放在这块玻璃平板上,光源系统通过一个传动机构作水平移动,发射出的光线照射在原图上,经反射或透射后,由接收系统接收并生成模拟信号,再通过A/D转换成数字信号,直接传送到电脑,由电脑进行相应的处理,完成扫描过程。平板式扫描仪的扫描速度、精度、质量很好,已得到了很好的普及。
图像数字化器的性能评价项目 项 目 内 容 空间分辨率 单位尺寸能够采样的像素数。由采样孔径与间距的大小和可变范围决定。 灰(色)度分辨率 项 目 内 容 空间分辨率 单位尺寸能够采样的像素数。由采样孔径与间距的大小和可变范围决定。 灰(色)度分辨率 量化为多少等级(位深度),颜色数(色深度) 图像大小 仪器允许扫描的最大图幅 量测特征 数字化器所测量和量化的实际物理参数及精度 扫描速度 采样数据的传输速度 噪声 数字化器的噪声水平(应当使噪声小于图像内的反差) 其他 黑白/彩色,价格,操作性能等
3 图像灰度直方图 3.1 概念 一、定义 灰度直方图反映的是一幅图像中各灰度级像素出现的频率。以灰度级为横坐标,纵坐标为灰度级的频率,绘制频率同灰度级的关系图就是灰度直方图。它是图像的一个重要特征,反映了图像灰度分布的情况。 下图是一幅图像的灰度直方图。 频率的计算式为
灰度图像的直方图
彩色图像的分波段直方图
二、计算 该图像像元总数为8*8=64, i=[0,7] v0=5/64 v1=12/64 vi v2=18/64 v3=8/64 1 3 2 5 7 6 4
3.2 直方图的性质 ①灰度直方图只能反映图像的灰度分布情况,而不能反映图像像素的位置,即丢失了像素的位置信息。 ②一幅图像对应唯一的灰度直方图,反之不成立。不同的图像可对应相同的直方图。图2.4.2给出了一个不同的图像具有相同直方图的例子。 图2.4.2 不同的图像具有相同直方图 ③一幅图像分成多个区域,多个区域的直方图之和即为原图像的直方图。
3.3 直方图的应用 ①用于判断图像量化是否恰当 ②用于确定图像二值化的阈值 (a) 恰当量化 (b)未能有效利用 (c)超过了动态范围 图2.4.4直方图用于判断量化是否恰当 ②用于确定图像二值化的阈值
具有二峰性的灰度图象
③当影像上目标的灰度值比其它部分灰度值大或者灰度区间已知时,可利用直方图统计图像中物体的面积。 A= (2.4-3) ④ 计算图像信息量H(熵) (2.4-4)
4 图像处理算法的形式 4.1图像处理基本功能的形式 按图像处理的输出形式,图像处理的基本功能可分为三种形式。 1)单幅图像 → 单幅图像 ,如图2.5.1(a)。 2)多幅图像 →单幅图像, 如图2.5.1(b)。 3)单(或多)幅图像→ 数字或符号等,如图2.5.1(c)。
4.2图像处理的几种具体算法 1.局部处理 邻域 对于任一像素(i,j),该像素周围的像素构成的集合{(i+p,j+q),p、q取合适的整数},叫做该像素的邻域。如图2.5.2(a)。 常用的邻域如图2.5.2(b)、(c),分别表示中心像素的4-邻域、8-邻域。 图2.5.2 像素的邻域
局部处理 对输入图像IP(i,j)处理时,某一输出像素JP(i,j)值由输入图像像素(i,j)及其邻域N(IP(i,j))中的像素值确定。这种处理称为局部处理。 局部处理的计算表达式为
例如 对一幅图象采用3×3模板进行卷积运算。
点处理 点处理的计算表达式为: 在局部处理中,当输出值JP(i,j)仅与IP(i,j)有关,则称为点处理,如图2.5.5。 图2.5.5 点处理
其计算表达式为: 大局处理 在局部处理中,输出像素JP(i,j)的值取决于输入图像大范围或全部像素的值,这种处理称为大局处理。如图25.6。 图2.5.6 大局处理
2.迭代处理 反复对图像进行某种运算直至满足给定的条件,从而得到输出图像的处理形式称为迭代处理。如2.5.7图像的细化处理过程。 3.跟踪处理 选择满足适当条件的像素作为起始像素,检查输入图像和已得到的输出结果,求出下一步应该处理的像素,进行规定的处理,然后决定是继续处理下面的像素,还是终止处理。这种处理形式称为跟踪处理。
输出像素JP(i,j)的值的计算方法与像素的位置(i,j)无关的处理称为位置不变处理或位移不变处理。 4.位置不变处理和位置可变处理 输出像素JP(i,j)的值的计算方法与像素的位置(i,j)无关的处理称为位置不变处理或位移不变处理。 随位置不同计算方法也不同的处理称为位置可变处理或位移可变处理。 5.窗口处理和模板处理 对图像的处理,一般采用对整个画面进行处理,但也有只对画面中特定的部分进行处理的情况。这种处理方式的代表有窗口处理和模板处理。 单独对图像中选定的矩形区域内的像素进行处理的方式叫做窗口处理 图2.5.8窗口处理
希望单独处理任意形状的区域时,可采用模板处理。 模板:任意形状的区域; 模板平面:一个和处理图像相同大小的二维数组,用来存储模板信息。一般是一幅二值图像; 模板处理:边参照模板平面边对图象进行某种操作。 若模板成矩形区域,则与窗口处理具有相同的效果,但窗口处理与模板处理不同之处是后者必须设置一个模板平面。
5 图像的数据结构与特征 5.1 图像的数据结构 1.组合方式 图像处理 解压 组合方式是一个字长存放多个像素灰度值的方式。它能起到节省内存的作用,但导致计算量增加,使处理程序复杂。 图像处理 解压 压缩 组合方式
2.比特面方式 按比特位存取像素,即将所有像素的相同比特位用一个二维数组表示,形成比特面。n个比特位的灰度图像采用比特面方式存取就有n个比特面。这种结构能充分利用内存空间,便于比特面之间的逻辑运算,但对灰度图像处理耗时多。 n-1 2 1 0
3.分层结构 由原始图像开始依次构成像素数愈来愈少的一幅幅图像,就能使数据表示具有分层性,其代表有锥形(金字塔)结构。 锥形结构是对2k×2k个像素形成的图像,看成是分辨率不同的k+1幅图像的层次集合, 即20×20→2k×2k。但20×20不具有反映输入图像的信息。 如图2.6.1所示,从输入图像I0开始,依序产生像素数纵横都按1/2递减的一幅一幅的图像I1,I2,…Ik。此时,作为图像Ii的各像素的值,就是它前一个图像Ii-1的相应的2×2像素的平均值(一般采用平均值,但也可以采用能表示2×2像素的性质的某个值)确定。
用这种方法,可以把图像用树结构(4叉树)表示。这可以用在特征提取和信息压缩等方面。 处理具有这种结构的数据时,首先对像素数少的图像进行处理,然后根据需要,进到下面的像素数多的图像的对应位置,使用较丰富的信息进行处理。同只对原始图像进行处理的场合相比,这种先对粗图像进行处理,并限定应该仔细进行处理的范围,再进行精处理的方法,可使处理的效率得到提高。 4.树结构 对于如图所示的一幅二值图像的行、列接连不断地二等分,如果图像被分割部分中的全体像素都变成具有相同的特征时,这一部分则不再分割。 用这种方法,可以把图像用树结构(4叉树)表示。这可以用在特征提取和信息压缩等方面。
5.多重图像数据存储 在获取的彩色图像(红、绿、兰)或多波段图像中,每个像素包含着多个图像的信息。对这类图像数据的处理,以多谱图像为例,有下列三种存储方式: ①逐波段存储,分波段处理时采用; ②逐行存储,行扫描记录设备采用; ③逐像素存储,用于分类。
5.2 图像文件格式 按不同的方式进行组织或存储数字图像像素的灰度,就得到不同格式的图像文件。图像文件按其格式的不同具有相应的扩展名。常见的图像文件格式按扩展名分为:RAW格式、BMP格式、TGA格式、PCX格式、GIF格式、TIFF格式等。 1.RAW格式 它是将像素按行列号顺序存储在文件中。这种文件只含有图像像素数据,不含有信息头,因此,在读图像时,需要事先知道图像大小(矩阵大小)。它是最简单的一种图像文件格式。 2.BMP格式 由以下四个部分组成 1)14字节的文件头; 2)40字节的信息头; 3)8字节的颜色定义; 4)位图数据。
1)位图文件头BITMAPFILEHEADER 它的结构如下: typedef struct tagBITMAPFILEHEADER{ WORD bfType; /*指定文件类型,必须是0x424D,即字符串“BM” */ DWORD bfSize; /*指定文件大小 */ WORD bfReserved1;为/*保留字 */ WORD bfReserved2; /*保留字 */ DWORD bfOffBits;为/*文件头到实际的位图数据的偏移字节数 * / }BITMAPFILEHEADER, FAR *LPBITMAPFILEHEADER; 该结构的长度是固定的,为14个字节 。 2)位图信息头BITMAPINFOHEADER 结构的长度为40个节 , 其结构如下: typedef struct tagBITMAPINFOHEADER{ DWORD bfSize; /* 指定这个结构的大小,为40个字节 LONG biWidth; /*指定图像的宽度,单位是像素 LONG biHeight; /*指定图像的高度,单位是像素; WORD biPlanes; /*必须是1 WORD biBitCount; /*指定表示颜色位数,1(黑白)8(256色)、24(真彩色) DWORD biCompression; /*指定是否压缩,分别为BI_RGB、BI_RLE4、BI_RLE8 DWORD biSizeImage; /*指定实际的位图数据占用的字节数。 LONG biXPelsPerMeter; /*指定目标设备的水平分辨率 LONG biYPersPerMeter; /*指定目标设备的垂直分辨率 DWORD biClrUsed; /*指定本图像实际用到的颜色数 DWORD biClrImportant; /*指定本图像中重要的颜色数 }BITMAPINFOHEADER, FAR *LPBITMAPINFOHEADER;
3)palette(调色板) 调色板实际上是一个数组 ,数组中每个元素的类型为一个RGBQUAD结构,占4个字节。结构定义如下: typedef struct tagRGBQUAD{ BYTE rgbBlue; BYTE rgbGreen; BYTE rgbRed; BYTE rgbReserved; }RGBQUAD; 有些位图,比如真彩色图,没有调色板。他们的位图信息头后直接是位图数据。 4)位图数据 它分两种情况:对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值;对于真彩色图,图像数据就是实际的R、G、B值。
a)位图是1,4,8位时,有调色板。 对于2色位图,用1位就可以表示该像素的颜色,因此一个字节可以表示8个像素; R G B 对于2色位图,用1位就可以表示该像素的颜色,因此一个字节可以表示8个像素; 对于16色位图,用4位可以表示一个像素的颜色,所以1个字节可以表示2个像素; 对于256色位图,一个字节刚好表示一个像素;
b) 位图是24位(真彩色)时,无调色板 B1 G1 R1 B2 G2 R2 : Bn Gn Rn 对于真彩色图,3个字节才能表示1个像素.
6 图像的特征 1.图像的特征 1)自然特征 ①光谱特征 ②几何特征 ③时相特征 2)人工特征 ①直方图特征 ②灰度边缘特征 ③线、角点、纹理特征
图像的特征有很多,按提取特征的范围大小又可分为: ①点特征 仅由各个像素就能决定的性质。如单色图像中的灰度值、彩色图像中的红(R)、绿(G)、蓝(B)成分的值。 ②局部特征 在小邻域内所具有的性质,如线和边缘的强度、方向、密度和统计量(平均值、方差等)等。 ③区域特征 在图像内的对象物 (一般是指与该区域外部有区别的具有一定性质的区域)内的点或者局部的特征分布,或者统计量,以及区域的几何特征(面积、形状)等。 ④整体特征 整个图像作为一个区域看待时的统计性质和结构特征等。
2.特征提取 获取图像特征信息的操作称作特征提取。它作为模式识别、图像理解或信息量压缩的基础是很重要的。通过特征提取,可以获得特征构成的图像(称作特征图像)和特征参数。 图2.6.3图像的特征提取
3.特征空间 把从图像提取的m个特征量y1,y 2,…,ym,用m维的向量Y=[y1 y2…ym]t表示称为特征向量。另外,对应于各特征量的m维空间叫做特征空间。 图2.6.4 特征空间聚类
作业: 1、图像数字化概念、数字化参数对图像质量的影响? 2、 图像灰度直方图的概念、如何计算、 性质及其应用。