数字图像处理 (Digital Image Processing) 数字图像处理与模式识别研究所 山东科技大学信电学院
1.学习成绩考核方法 作业20%,考勤10%,期末考试70%。 2.本课程主要参考书 [1] 章毓晋. 图像处理与分析. 北京:清华大学出版社.1999. [2] 阮秋琦. 数字图像处理,北京:电子工业出版社.2001. [3] 冈萨雷斯著.阮秋琦、阮宇智等译.数字图像处理. 北京:电子工业出版社,2005. [4] 刘文耀. 光电图像处理. 北京:电子工业出版社.2002. [5] Kenneth.R.Castleman 著,朱志刚等译.数字图像处理. 北京:电子工业出版社,1998. 3.网上学习和答疑 本讲课内容将放在山东科技大学信电学院网页(http://www.sdust.edu.cn),并在网上答疑。
主要章节和内容 第一章 绪论 第二章 数字图像处理的基本知识 第三章 图像处理中的常用数学变换 第四章 图像增强 第五章 图像复原 第六章 图像压缩编码 第七章 图像分割 第八章 图像描述 第九章 数学形态学 第十章 数字图像技术应用系统设计
第一章 绪论 1.1 图像和图像工程 1.1.1 图像的概念 1.1.2 图像处理技术分类 1.1.3 图像处理及相关学科简介 第一章 绪论 1.1 图像和图像工程 1.1.1 图像的概念 1.1.2 图像处理技术分类 1.1.3 图像处理及相关学科简介 1.2 图像处理和分析 1.2.1 图像处理和分析系统 1.2.2 图像处理的应用 1.2.3 数字图像处理领域的发展方向
1.1 数字图像处理主要内容 1.1.1 图像的概念 1.概念:一幅图像是一种代表另一个客体(或对象)的一种写真或模拟;是一种生动的、图形化的描述。也就是说,图像是一种代表客观世界中另一物体的、生动的图形表达,它包含了描述其所代表的物体的信息。 2 图像分类 借助集合(即凡具有某种特定性质的对象的总合称之为集合)的概念,图像可根据其生成方法或存在形式分成若干类。所有图像的总体可以看作客观世界的一部分,或者叫做客观世界的一个子集,而图像本身又可进一步划分为若干子集(若干类)。图像的各子集中,最重要的一个子集是可见图像子集。
该子集包含了全部人眼可见(可接收到)的图像,其中不仅包括了客观存在的光学图像,而且也包括了人类用各种不同的方法人工生成的图像,即照片,图形与绘画。 各种可测到的(客观存在的)物理特征量的空间分布,构成一大类图像,称为物理图像。这些物理特征量是多种多样的,它既包括各种波长的电磁波强度的空间分布不同所构成的图像,也包括如温度分布、压力分布、高度分布、人口密度分布等等所构成的图像。可见光学图像只是电磁波场图像中的一个子集。其余各种物理图像(均是人眼不可见的)构成了不可见物理图像子集。 还应注意到,同一个空间点,可以具有多个物理特征;因此,同一对象(或物体)可以有多幅图像。例如彩照(或彩色电视图像),就是每一点均在红、绿、蓝三个波段上有不同强度分布的三幅图像的合成。
实际上,对任一个空间点,在该点可测到的物理特征都远远大于3,(但这些特征中绝大部分是人眼不可见的。)因此,任一对象都存在着大量的图像。 图像的另一个子集是抽象的数学图像,即用数学函数代表的图像,它包括了连续型与离散型(即数字图像)两大类。 在所有各类图像中,只有数字图像是可以用数字计算机直接处理的图像。计算机图像处理技术主要研究数字图像的处理。
1.1.2 图像处理技术分类 所谓处理是指对某一对象作一系列能导致预期结果的操作。 1.1.2 图像处理技术分类 所谓处理是指对某一对象作一系列能导致预期结果的操作。 图像处理就是按特定的目标,用一系列的特定的操作来“改造”图像。所谓特定的目标,可以是使图像更清晰、更美丽动人,也可以是从图像中提取某些特定的信息。 人类研究与应用图像处理技术的历史已很久远。例如哈哈镜就是-一种人为地使图像畸变的图像处理工具,望远镜与显微镜则是另一类图像处理工具,照片的放大技术则是一种干家万户受益的图像处理技术。多种多样的图像处理在人类科技发展史上发挥过极其重要的作用。但直到数字计算机问世以前,这些图像处理的共同特点是把图像看作模拟(连续)信号来处理,即都属于图像的模拟处理。
计算机应用到图形、图像信息处理领域,形成了数字图像处理这一新的学科。随着近年来超大规模集成电路技术与计算机结构、算法的发展,数字图像处理技术取得了惊人的进步,以至现在一提到图像处理几乎都是指图像的数字处理。计算机用于图像处理或者说计算机图像处理从其含义来说,可以是计算机控制下的模拟处理,也可以是计算机内的数字图像处理或计算机控制下处理数字图像存储器里的图像数据。但后者居多。所以一般认为计算机图像处理与数字图像处理是同义语。 图像的数字处理比模拟处理有许多明显的优点。数字处理与光学、照片、录象等类模拟处理相比较,主要优点是,可以灵活、多变地实现各种处理,既可对图像作线性变换处理,亦可作非线性变换处理。并且处理精度高,再现性好。
数字图像处理的主要内容有: 数字图像处理概括他说主要包括如下几项内容:几何处理(Geometrical Processing),算术处理(Arithmetic Processing),图像增强(Image Enhancement ),图像复原(Image Restoration),图像重建(Image Reconstruction),图像编码(Image Encoding),图像识别(Image Recognition),图像理解(lmage Understanding)。 (1)几何处理 几何处理主要包括坐标变换,图像的放大、缩小、旋转、移动,多个图像配准,全景畸变校正,扭曲校正,周长、面积、体积计算等。
(2)算术处理 算术处理主要对图像施以+、-、×、÷等运算,虽然该处理主要针对像素点的处理,但非常有用,如医学图像的减影处理就有显著的效果。 (3)图像增强 图像增强处理主要是突出图像中感兴趣的信息,而减弱或去除不需要的信息,从而使有用信息得到加强,便于区分或解释。主要方法有直方图增强、伪彩色增强法(pseudo color)、灰度窗口等技术。 (4)图像复原 图像复原处理的主要目的是去除干扰和模糊,恢复图像的本来面目。典型的例子如去噪就属于复原处理。图像噪声包括随机噪声和相干噪声,随机噪声干扰表现为麻点干扰,相干燥声表现为网纹干扰。去模糊也是复原处理的任务。这些模糊来自透镜散焦,相对运动,大气湍流,以及云层遮挡等。维纳滤波、逆滤波、同态滤波等方法加以去除。
(5)图像重建 几何处理、图像增强、图像复原都是从图像到图像的处理,即输入的原始数据是图像,处理后输出的也是图像,而重建处理则是从数据到图像的处理。也就是说输入的是某种数据,而处理结果得到的是图像,该处理的典型应用就是CT技术。CT技术发明于1972年,早期为X射线(X-ray)CT,后来发展的有ECT、超声CT、核磁共振(NMR)等。图像重建的主要算法有代数法、迭代法、傅里叶反投影法、卷积反投影法等,其中以卷积反投影法运用最为广泛,因为它的运算量小、速度快。值得注意的是三维重建算法发展得很快,而且由于与计算机图形学相结合,把多个二维图像合成三维图像,并加以光照模型和各种渲染技术,能生成各种具有强烈真实感及纯净的高质量图像。三维图形的主要算法有线框法、表面法、实体法、彩色分域法等等,这些算法在计算机图形学中都有详尽的介绍。三维重建技术也是当今颇为热门的虚拟现实和科学可视化技术的基础。
(6)图像编码 图像编码研究属于信息论中信源编码范畴,其主要宗旨是利用图像信号的统计特性及人类视觉的生理学及心理学特性对图像信号进行高效编码,即研究数据压缩技术,以解决数据量大的矛盾。一般来说,图像编码的目的有三个:①减少数据存储量;②降低数据率以减少传输带宽;③压缩信息量,便于特征抽取,为识别作准备。就编码而言,以去除冗余为基础的编码方法称为第一代编码。如:PCM、DPCM。△M、亚取样编码法;变换编码中的DFT、DCT、Walsh-Hadamard变换等方法以及以此为基础的混合编码法均属于经典的第一代编码法。而第二代编码方法多是20世纪80年代以后提出的新的编码方法,如余字塔编码法,Fractal编码、基于神经元网络的编码方法、小波变换编码法、模型基编码法等,现代编码法的特点是:①充分考虑人的视觉特性;②恰当地考虑对图像信号的分解与表述;③采用图像的合成与识别方案压缩数据率。
(7)模式识别 模式识别是数字图像处理的又一研究领域。当今,模式识别方法大致有三种,即:统计识别法;句法结构模式识别法;模糊识别法。 统计识别法侧重于特征,句法结构识别侧重于结构和基元,模糊识别法是把模糊数学的一些概念和理论用于识别处理。在模糊识别处理中充分考虑人的主观概率,同时也考虑了人的非逻辑思维方法及人的生理、心理反映,这一独特性的识别方法目前正处于研究阶段,方法尚未成熟。 (8)图像理解 图像理解是由模式识别发展起来的方法。该处理输入的是图像,输出的是一种描述。这种描述并不仅是单纯的用符号作出详细的描绘,而且要利用客观世界的知识使计算机进行联想、思考及推论,从而理解图像所表现的内容。图像理解有时也叫景物理解。在这一领域还有相当多的问题需要进行深入研究。
以上所述的8项处理任务是图像处理所涉及到的主要内容。总的说来,经多年的发展,图像处理经历了从静止图像到活动图像;从单色图像到彩色图像;从客观图像到主观图像;从二维图像到三维图像的发展历程。特别是与计算机图形学的结合已能产生高度逼真、非常纯净、更有创造性的图像。由此派生出来的虚拟现实技术的发展或许将从根本上改变我们的学习、生产和生活方式。
天津复康路三维实景虚拟
居室虚拟1
居室虚拟2
自然景观模拟
美人鱼
4 数字图像处理的主要方法 数字图像处理方法大致可分为两大类,即:空域法和变换域法。 1.空域法 这种方法是把图像看作是平面中各个像素组成的集合,然后直接对这-二维函数进行相应的处理。空域处理法主要有下面两大类: (1)邻域处理法 其中包括:梯度运算(Gradient Algorithm),拉普拉斯算子运算(Laplacian Operator),平滑算子运算(Smoothing Operator)和卷积运算(Convolution Algorithm)。 (2)点处理法 灰度处理(grey processing),面积、周长、体积、重心运算等等。
2.变换域法 数字图像处理的变换域处理方法是首先对图像进行正交变换,得到变换域系数阵列,然后再施行各种处理,处理后再反变换到空间域,得到处理结果。 这类处理包括:滤波、数据压缩、特征提取等处理。
1.1.3 图像处理及相关学科简介 1. 图像处理与图像技术 图像处理分成三个层次,各个层次包含相应的处理技术。 图像理解 图像分析 像素 目标 符号 高层 低层 操 作 对 象 中层 语义 低 高 抽象程度 大 小 数据量
2. 图像处理与相关学科的关系 相关学科:计算机图形学;模式识别;计算机视觉等 。 它们之间的关系如下图所示: 图像 图像处理 客 计 模 (人) 符号 数据 计算机图形学 图像理解 图像处理 (转换) 模 式 识 别 计 算 机 视 觉 新 新 新 理 工 技 论 具 术 客 观 世 界 图像分析
1.2 图像处理和图像分析 1.2.1 数字图像处理系统
1 数字图像获取主要工具 摄象机,扫描仪,遥感仪,绘图工具(软件)。 2 数字图像输出和显示 硬拷贝:各种打印机,绘图仪,胶片记录器。 显示:各种计算机显示屏。 3 数字图像存储 磁盘(硬软盘),磁带,光盘。
一些较新的数字图像设备 彩色打印机
大面幅彩色打印机
摄像头
数码相机
数码摄像机
1.2.2 数字图像处理应用 图像处理技术发展到今天,许多技术已日趋成熟。在各个领域的应用取得了巨大的成功和显著的经济效益。如在工程领域、工业生产、军事、医学以及科学研究中的应用已十分普遍。通过分析资源卫星得到的照片可以获得地下矿藏资源的分布及埋藏量;利用红外线、微波遥感技术可侦查到隐蔽的军事设施;X射线CT已广泛应用于临床诊断,由于它可得到人体内部器官的断层图像,因此,可准确地确定病灶位置,为诊断和治疗疾病带来了极大的方便。至于在工业生产中的设计自动化及产品质量检验中更是大有可为。在安全保障及监控方面图像处理技术更是不可缺少的基本技术。至于在通信及多媒体技术中图像处理更是重要的关键技术。因此,图像处理技术在国计民生中的重要意义是显而易见的。正因为如此,图像的理理论和技术受到了各界的广泛重视,科学工作者经过不懈的努力,已取得了令人瞩目的成就,并正在向更加深人及更高的层次发展。
具体应用领域可粗略概括如下: 物理、化学: 结晶分析、谱分析; 生物、医学: 细胞分析、染色体分类、血球分类、X射 线照片分析、CT; 环境保护: 水质及大气污染调查; 地质: 资源勘探、地图绘制、GIS; 农林: 植被分布调查、农作物估产; 海洋: 鱼群探查、海洋污染监测; 水利: 河流分布、水利及水害调查; 气象: 云图分析等; 通信: 传真、电视、多媒体通信; 工业一交通: 工业探伤、铁路选线、机器人、产品质 量监测; 经济: 电子商务、身份认证、防伪; 军事: 军事侦察、导弹制导、电子抄盘、军事 训练等; 法律: 指纹识别等;
应用的典型例子有: (1)遥感:在遥感应用中,我们可以看到大量的与图像处理密切相关的技术。从世界上出现第一幅照片(1839年)、意大利人乘飞机拍摄了第一张照片(1909年)、前苏联(1957年)及美国(1958年)发射第一颗人造地球卫星等都为遥感技术的发展奠定了坚实的基础。1962年国际上正式使用遥感一词(Remote Sensing)。此后,美国相继发射多颗陆地资源探测卫星(1972年,LANDSAT-I—四个波段,地面分辨率59m×79m;1975年,LANDSAT-Ⅱ;1978年,LANDSAT-Ⅲ,分辨率40m×40m;1982年,LANDSAT-Ⅳ,分辨率30m×30m,在这颗卫星上配置了GPS系统(Global Positioning System),定位精度在地心坐标系中为土10m。 遥感图像处理的用处越来越大,效率及分辨率也越来越高。如:土地测绘、资源调查、气象监测,环境污染监测、农作物估产、军事侦察等。当前,在遥感图像处理中主要解决数据量大和处理速度慢的矛盾。
(2)医学:图像处理在医学界的应用非常广泛,无论是在临床诊断还是病理研究都大量采用图像处理技术。它的直观、无创伤、安全方便的忧点受到普遍的欢迎与接受。其主要应用如X射线照片的分析,血球计数与染色体分类等。目前广泛应用于临床诊断和治疗的各种成像技术,如超声波诊断等都用到图像处理技术。有人认为计算机图像处理在医学上应用最成功的例子就是X射线CT(X-ray Computed Tomography)。1968-1972年英国的EMI公司的Hounsfeld研制了头部CT,1975年又研制了全身CT。其中主要研制者Hounsfeld(英)和Commack(美)获得了1979年的诺贝尔生理医学奖。类似的设备目前已有多种,如核磁共振CT(NMRI,Nuclear Magnetic Resonance Imaging),电阻抗断层图像技术(EIT,Electrical Impedance Tomography)和阻抗成像(Impedance Imaging),这是一种利用人体组织的电特性(阻抗、导纳、介电常数)形成人体内部图像的技术。
(2)医学:图像处理在医学界的应用非常广泛,无论是在临床诊断还是病理研究都大量采用图像处理技术。它的直观、无创伤、安全方便的忧点受到普遍的欢迎与接受。其主要应用如X射线照片的分析,血球计数与染色体分类等。目前广泛应用于临床诊断和治疗的各种成像技术,如超声波诊断等都用到图像处理技术。有人认为计算机图像处理在医学上应用最成功的例子就是X射线CT(X-ray Computed Tomography)。1968-1972年英国的EMI公司的Hounsfeld研制了头部CT,1975年又研制了全身CT。其中主要研制者Hounsfeld(英)和Commack(美)获得了1979年的诺贝尔生理医学奖。类似的设备目前已有多种,如核磁共振CT(NMRI,Nuclear Magnetic Resonance Imaging),电阻抗断层图像技术(EIT,Electrical Impedance Tomography)和阻抗成像(Impedance Imaging),这是一种利用人体组织的电特性(阻抗、导纳、介电常数)形成人体内部图像的技术。
①电视广播:单色电视广播1925年在英国实现。1936年BBC开始电视广播。目前出现的彩色电视有三种制式,即NTSC(美国、日本等)、PAL(中国、西欧、非洲等)和SECAM(法国、俄罗斯等)。 ②可视电话和会议电视:1964年美国国际博览会展出了Picture-phone MOD-I可视电话系统,带宽为1MHz,目前的可视电话/会议电视均采用数字压缩技术,也出现了相应的国际标准。如:图像编码标准H.261、H.263等,会议电视的H.230标准,在专用通信网中用PCM一次群传输,速率为2048kb/s。桌面型系统遵循H.323标准。 ③传真:是把文字、图表、照片等静止图像通过光电扫描的方式变成电信号加以传送的设备。经过多年发展,传真技术不断进步,现在已有仅数秒钟就可传送一幅A4文件的传真机,分辨率高达16点/毫米。
④图文电视和可视图文:图文电视(Teletext)和可视图文(Videotext)是提供可视图形文字信息的通信方式,图文电视是单向传送信息,它是在电视信号消隐期发送图文信息,用户可用电视机和专用终端收看该信息;可视图文是双向工作方式,用户可用电话向信息中心提出服务内容或从数据库中选择信息。 总之,图像处理技术应用还可列出相当多的领域,它在国家安全、经济发展、日常生活充当越来越重要的角色,对国计民生的作用不可低估。
1.2.3 数字图像处理领域的发展方向 在该领域中需进一步研究的问题,不外乎如下五个方面: l)在进一步提高精度的同时着重解决处理速度问题。如在航天遥感、气象云图处理方面,巨大的数据量和处理速度仍然是主要矛盾之一。 2)加强软件研究、开发新的处理方法,特别要注意移植和借鉴其他学科的技术和研究成果,创造新的处理方法。 3)加强边缘学科的研究工作,促进图像处理技术的发展。如:人的视觉特性、心理学特性等的研究如果有所突破,将对图像处理技术的发展起到极大的促进作用。 4)加强理论研究,逐步形成图像处理科学自身的理论体系。 5)时刻注意图像处理领域的标准化问题。图像的信息量大、数据量大,因而图像信息的建库、检索和交流是一个极严重的问题。就现有的情况看,软件、硬件种类繁多,交流和使用极为不便,这成了资源共享的严重障碍。应及早建立图像信息库,统一存放格式,建立标准子程序,统一检索方法。
图像处理技术未来发展大致可归纳为如下四点: 1)图像处理的发展将向着高速、高分辨率、立体化、多媒体化、智能化和标准化方向发展。围绕着HDTV(高清晰度电视)的研制将开展实时图像处理的理论及技术研究。其中包括:提高硬件速度;提高分辨率;三维图像化;多媒体化;智能化;标准化。 2)图像、图形相结合朝着三维成像或多维成像的方向发展。 3)硬件芯片研究。 4)新理论与新算法研究 在图像处理领域近年来引入了-些新的理论并提出了-些新的算法,如:Wavelet、Fractal、Morphology、遗传算法、神经网络等,其中Fractal广泛用于图像处理、图形处理、纹理分析,同时还可以用于数学、物理、生物、神经和音乐等方面,有人认为Fractal把杂乱无章、随意性很强的事物能用数学方法加以规范和描述,它在分析和描绘自然现象上具有独到之处。这些理论在未来图像处理理论与技术上的作用应给予充分的注意,并积极地加以研究。