对本书、视频等任何MATLAB问题,作者做到有问必答! 你买的不仅仅是书,更是一种“有问必答”的服务!
视频目录 视频版权归作者所有,请勿翻录 投稿请联系:627173439@qq.com
“有问必答”三部曲 第一步:购买该书(当当、亚马逊等均有销售) 第二步:拿到书籍以后,封面上有卡,如下图所示: 根据封面提示,验证密码,即可享受作者“有问必答”服务! 有问必答网址: www.iLoveMATLAB.cn/forum-224-1.html 刮开即可看到密码
第1章 数字图像基础 随计算机技术的发展,20世纪50年代,人们应用计算机处理一些图形和图像信息,这是最早的图像处理;20世纪60年代,人们应用计算机改善图像的质量,这时形成了数字图像处理这门学科。本章主要介绍数字图像处理的基础内容,包括什么是数字图像基础、图像的表示方法、图像的数据结构以及计算机中图像文件格式。
1.1数字图像处理简介 数字图像处理(Digital Image Processing)又称为计算机图像处理,是一种将图像信号数字化后利用计算进行处理的过程。随着计算机科学、电子学和光学的发展,数字图像处理已经广泛的应用到诸多领域之中。本小节主要介绍图像的概念、分类和数字图像处理的产生以及数字图像处理的研究内容。
1.1.1什么是图像 图像是三维世界在二维平面的表示,具体来说就是用光学器件对一个物体,一个人或是一个场景等的可视化表示。图像中包含了它所表达的事物的大部分信息,据有关资料表示,人类所获得的大部分信息来源于视觉系统,也就是从图像中获得的。中国有句古话叫“耳听为虚,眼见为实”,可见一斑。
1.1.2图像的分类 根据图像的属性不同,图像分类方法也不同。从获取方式上图像分为拍摄类图像和绘制类图像;从颜色上图像分为彩色图像、灰度图像和黑白图像等;从图像的内容上图像分为人物图像,风景图像等;从功能上又分为流程图、结构图、心电图、电路图、设计图等。 在数字图像处理领域,将图像分为模拟图像和数字图像两种,计算机处理的信号都是数字信号,所以在计算机上处理的图像均为数字图像。根据数字图像在计算机中表示方法不同,分为二进制图像,索引图像,灰度图像,RGB图像和多帧图像;根据计算机中图像文件格式不同,图像又分为位图和矢量图。可见,图像的属性是多角度的,图像的分类也是多维的。
1.1.3数字图像的产生 数字图像的产生主要有两种渠道,一种是通过像数码照相机这样的设备直接拍摄得到数字图像,还有一种是通过图像采集卡、扫描仪等数字化设备,将模拟图像转变为数字图像。
1.1.4数字图像处理的研究内容 数字图像处理的研究内容主要有以下方向: 1.图像运算与变换 2. 图像增强 3. 图像复原 数字图像处理的研究内容主要有以下方向: 1.图像运算与变换 2. 图像增强 3. 图像复原 4. 图像的锐化处理及边缘检测 5. 图像分割 6. 图像编码压缩
1.1.5数字图像处理的实验工具 数字图像处理是通过计算机完成的,首先需要数字图像获取工具得到数字图像,图像获取工具(例如扫描仪)可以将模拟图像转换为数字图像,也可以直接通过图像获取工具(例如数码照相机)直接产生数字图像。数字图像产生后,传输到计算机中,通过计算机中的图像处理软件或是用户编写的图像处理程序都可以对图像进行出路,专业应用还可以通过图像处理工作站对专业图像处理。数字图像处理需要对大量的数据进行运算,所以通常需要计算机计算速度快,内存空间大和大的硬盘存储能力。经过处理的图像主要通过显示器显示出来,有时根据需要还要求通过打印机打印出来等。数字图像处理系统如图1.7所示。
1.2图像的表示方法 图像的表示方法是对图像处理算法描述和利用计算机处理图像的基础。一个二维图像,在计算机中通常为一个二维数组f (x, y),或者是一个M×N的二维矩阵(其中,M为图像的行数,N为图像的列数 本小节主要介绍5种图像的表示方法:二进制图像,索引图像,灰度图像,RGB图像和多帧图像。
1.2.1二进制图像 二进制图像也称为二值图像,通常用一个二维数组来描述,1位表示一个像素,组成图像的像素值非0即1,没有中间值,通常0表示黑色,1表示白色,如图1.8所示。二进制图像一般用来描述文字或者图形,其优点是占用空间少,缺点是当表示人物或风景图像时只能描述轮廓。
1.2.2灰度图像 灰度图像也称为单色图像,通常也由一个二维数组表示一副图像,8位表示一个像素,0表示黑色,255表示白色,1~254表示不同的深浅灰色,一副灰度图像放大4×4大小像素,如图1.9所示。通常灰度图像显示了黑色与白色之间许多级的颜色深度,比人眼所能识别的颜色深度范围要宽的多。
1.2.3RGB图像 RGB图像也称为真彩色,是一种彩色图像的表示方法,利用3个大小相同的二维数组表示一个像素,3个数组分别代表R、G、B三个分量,R表示红色,G表示绿色,B表示蓝色,通过三种基本颜色可以合成任意颜色,如图1.10所示RGB图像。每个像素中的每种颜色分量占8位,每一位由[0,255]中的任意数值表示,那么一个像素由24位表示,允许的最大值为224(即1677216,通常记为16M)。
1.2.4索引图像 索引图像是一种把像素值直接作为RGB调色板下标的图像。在MATLAB中,索引图像包含一个数据矩阵X和一个颜色映射(调色板)矩阵map。数据矩阵可以是8位无符号整型、16位无符号整型或双精度类型的。
1.2.5多帧图像 多帧图像是一种包含多幅图像或帧的图像文件,又称为多页图像或图像序列,主要用于需要对时间或场景上相关图像集合进行操作的场合。例如,计算机X线断层扫描图像或电影帧等。
1.3图像的数据结构 数字图像处理中常用的数据结构有矩阵,链表,拓扑结构和关系结构。图像的数据结构用于目标表示和描述。本小节主要介绍矩阵、链表、拓扑结构和关系结构描述图像、图像的边界、区域和区域之间的关系。
1.3.1矩阵 矩阵用于描述图像,可以表示黑白图像、灰度图像和彩色图像。矩阵中的一个元素表示图像的一个像素。矩阵描述黑白图像时,矩阵中的元素取值只有0和1两个值,因此黑白图像又叫二值图像或二进制图像。矩阵描述灰度图像时,矩阵中的元素由一个量化的灰度级描述,灰度级通常为8位,即0~255之间的整数,其中0表示黑色,255表示白色。
1.3.2链码 链码用于描述目标图像的边界,通过规定链的起始坐标和链起始点坐标的斜率用一小段线段来表示图像中的曲。链码按照标准方向的斜率分为4向链码或8向链码,如下图所示。因为链码表示图像边界时只需标记起点坐标,其余点用线段的方向数代表方向即可,这种表示方法节省大量的存储空间。
1.3.3拓扑结构 拓扑结构用于描述图像的基本结构,通常在于形态学的图像处理或是二值图像中,用于描述目标事件发生的次数,在一个目标事件中有多少个孔洞,有多少联通区域等。在图像中定义相邻的概念,一个像素与它周围的像素组成一个邻域,如下图所示,像素点p周围有8个相邻的像素点,若只考虑上下左右则有4个像素点则称为4-邻域,若只考虑对角上的4个像素点则称为对角邻域,4-邻域和对角邻域都加上称为8-邻域。
1.3.4关系结构 关系结构用于描述一组目标物体之间的相互关系,常用的描述方法为串描述和树描述。串描述是一种一维结构,当用串描述图像时,需要建立一种合适的映射关系,将二维图像降为一维形式。串描述适用于那些图像元素的连接可以用来从头到尾或用其他连续形式的图像元素的描述。链码表示就是基于串描述思想描述的。
1.4计算机中图像文件格式 数字图像在计算机中存储的格式有多种多样,每一种文件格式都包括一个头文件和一个数据文件。头文件的内容由制作图像的公司规定,一般包括文件类型、制作时间,文件大小制作人及版本号等信息。文件制作时还涉及到图像的压缩和存储效率等。本小节主要介绍BMP文件格式,GIF文件格式,JPEG文件格式和TIFF文件格式。
1.4.1BMP文件格式 BMP文件格式是Windows系统中的一种标准图像文件格式,支持 RGB、索引颜色、灰度和位图颜色模式。BMP文件一共有两种类型,设备相关位图(DDB)和设备无关位图(DIB)。Windows3.0以前的BMP文件格式与显示设备有关,因此把这种BMP文件格式称为设备相关位图DDB(device-dependent bitmap)文件格式。Windows 3.0以后的BMP文件与显示设备无关,因此把这种BMP图象文件格式称为设备无关位图DIB(device-independent bitmap)格式。BMP文件默认的文件扩展名是 .BMP或 .bmp。
1.4.2 GIF文件格式 GIF文件格式是CompuServe公司在 1987年开发的图像文件格式,任何商业目的使用均须由CompuServe公司授权。 GIF文件主要是为数据流设计的一种传输格式,不作为文件的存储格式,它具有顺序的结构形式。GIF文件主要由五部分组成: 文件标志块,识别标识符“GIF”和版本号; 逻辑屏幕描述块,定义图像显示区域的参数,包含背景颜色信息、显示区域大小、纵横尺寸、颜色深浅以及是否存在全局彩色表; 全局彩色表,其大小由图像使用的颜色数决定; 图像数据块,包含图像的描述块,局部彩色表,压缩图像数据,图像控制扩展块,无格式文本扩展块,注释扩展块,应用程序扩展块,此部分可以缺省; 尾块,为三维16进制数,表示数据流已经结束,此部分可以缺省。
1.4.3 JPEG文件格式 JPEG是Joint Photographic Experts Group的缩写,即联合国图像专家组。作为一种图像文件格式,JPEG格式联合国图像专家组制定,文件扩展名 .jpg或 .jpeg。JPEG格式的图像文件具有迄今为止最为复杂的文件结构和编码方式,和其他格式的最大区别是JPEG使用一种有损压缩算法,是以牺牲一部分的图像数据来达到较高的压缩率,但是这种损失很小以至于很难察觉。JPEG格式又可分为标准JPEG、渐进式JPEG及JPEG2000三种格式,这三种格式的区别主要在Internet图像显示方式上。标准JPEG格式图像在网页下载时只能由上而下依序显示图像,直到图像全部下载完毕,才能看到全貌。渐进式JPEG格式可以在网页下载时,先呈现出图像的粗略外观后,再慢慢地呈现出完整的内容。JPEG2000格式是新一代的影像压缩法,压缩品质更好,并可改善无线传输时,常因讯号不稳造成马赛克及位置错乱的情况,改善传输的品质。
1.4.4 TIFF文件格式 TIFF格式最初由Aldus公司与微软公司一起为PostScript打印开发,是一种主要用来存储包括照片和艺术图在内的图像的文件格式,文件扩展名为 .tif 或 .tiff。 TIFF文件格式主要包括三个部分: 文件头,有固定的位置,位于文件的最前端,是文件中惟一的,包含一个标志参数指出标识信息区在文件中的存储地址及正确解释TIFF文件的其他部分所需的必要信息; 标识信息区,是用于区分一个或多个可变长度数据块的表,包含了有关于图像的所有信息。图像文件目录中提供了一系列的指针,这些指针指向各种有关的数据字段在文件中的初始地址,并给出每个字段的数据类型及长度; 图像数据,根据图像文件目录所指向的地址存储相关的图像信息。
1.5本章小结 本章主要介绍了一些数字图像处理的基础知识。首先,介绍了图的产生像的概念、分类以及数字图像的产生,数字图像处理研究的内容和处理的实验工具。其次,介绍了图像的表示方法,其中包括二进制图像、灰度图像、RGB图像,索引图像和多帧图像。接下来,主要给出描述图像的四种数据结构,包括矩阵,链码,拓扑结构和关系结构。最后,详细说明了计算机图像的文件的四种格式:BMP格式、GIF格式、JPEG格式和TIFF格式。本章中涉及的都是数字图像处理的基本内容,可以在以后章节结合MATLAB知识,加深对数字图像处理的理解。
习题 1.1 什么是数字图像?数字图像处理有哪些特点? 1.2 数字图像处理有哪些主要内容? 1.3 RGB图像表示方法与索引图像表示方法上有哪些区别?