图形图像处理 潘荣江 山东大学计算机科学与技术学院 panrj@sdu.edu.cn
1、图形与图像 矢量表示 图形表示 ●图像:直接量化的原始信号形式 ●图形:运算形成的抽象化产物 ● 图形由具有方向和长度的 ● 用于分析运算结果,简单 图形表示 ● 图像的最小单位是像素 ● 用于表现自然影像
Images and Graphics
2 获取图像 三维坐标(W1,W2,W3)二维坐标(r,s) Projection of real world to image plane following the central projection equation:
采样、量化、编码 2 levels 16 levels 256 levels 1 bit (2色) 3 bit (8色) 2 bit (4色) 5 bit (32色) 4 bit (16色)
Picture Elements: Pixel Color images gray-value images binary images (e.g., values 1 for black, 0 for white)
位图图像 存在严格的“位映射”关系 8bit ( 28 = 256色 ) 16bit ( 216 = 65536色 ) ● 图像由基本显示单元“像素”构成 ● 像素由若干个二进制位进行描述 图像像点 ● 二进制位代表图像颜色的数量 ● 二进制位与图像之间 存在严格的“位映射”关系 8bit ( 28 = 256色 ) 16bit ( 216 = 65536色 ) 24bit ( 224 = 16M色 ) ● 具有位映射关系的图叫作“位图” ● “位图”特指图像 ● 8位图像 ● 16位图像 ● 24位图像
dpi (display pixels / inch) 图像分辨率 dpi 视觉效果 清晰度 绝对清晰度 ● Resolution (分辨率)单位 dpi (display pixels / inch) 每英寸显示的线数 ● dpi的数值越大,图像越清晰 300 dpi 96 dpi 21 dpi
常见分辨率 4800 dpi 普通:300dpi 高精度:600 dpi ● 平板扫描仪:1200 dpi ● 显示器:96 dpi ● 印刷图片 普通:300dpi 高精度:600 dpi ● 底片扫描仪 4800 dpi ● 激光打印机:600~1200 dpi ● 喷墨打印机:720~2880 dpi
像素深度 像素深度是指存储每个像素所用的位数 像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。 例如,一幅彩色图像的每个像素用R,G,B三个分量表示,若每个分量用8位,那末一个像素共用24位表示,就说像素的深度为24,每个像素可以是224=16 777 216种颜色中的一种。 往往把像素深度说成是图像深度。表示一个像素的位数越多,能表达的颜色数目就越多。
真彩色、伪彩色与直接色 真彩色(true color) 指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度。 真彩色图通常是指RGB 8:8:8,即图像的颜色数等于224,也常称为全彩色(full color)图像。 伪彩色(pseudo color) 每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,去查找一个显示图像时使用的R,G,B值,用查找出的R,G,B值产生的彩色称为伪彩色。
直接色(direct color) 每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。
Capturing / Recording format: Spatial resolution [pixel x pixel] Planes Color coding [bits/pixel] Storage format: 2-dimensional matrix representing pixels Example: Bitmap matrix containing binary values Color image: four important approaches 3 numbers representing intensities for red, green, blue (RGB) or ("true color" if numbers fine-grained enough, e.g., 8-bit; very common) 3 numbers representing pointers to color table (1 color per entry-R,G, or B) 1 number as pointer (index) to color table: "color lookup table CLUT“ (most common, apart from true color) e.g., 8 bit-pointer: 256 colors possible CLUT-entry 3 Bytes: one for each main color (256-out-of-16Mio) index to arbitrary data structures representing colors
图像文件 文件 颜色与分辨率 用途 .GIF 256 / 96dpi 用于动画、多媒体程序界面,网页界面 . BMP ● 数字化图像以文件的形式存在,其文件名有严格的约定 文件 颜色与分辨率 用途 .GIF 256 / 96dpi 用于动画、多媒体程序界面,网页界面 . BMP 256 ~ 224 / * dpi 用于Windows环境下的任何场合 . TIF 256 ~ 232 / * dpi 用于专业印刷 . JPG 216 ~ 232 / * dpi 用于数字图片保存、传送 . TGA 256 ~ 224 / 96dpi 用于专业动画影视制作 . PCD 用于PHOTO CD ● 注意:图像文件的扩展名不要轻易修改,否则不能使用
PS
Follow-up: Adobe’s PORTABLE DOCUMENT FORMAT (PDF) History: Developed 1984 by Adobe First time fonts became important to the general public Functionality: Integration of high-quality text, graphics and images programming language full-fledged with variables, control structures and files Postscript Level-1: Earliest version developed in 1980ies Scalable font concept (in contrast to fixed-size fonts available until then) Problem: no patterns available to fill edges of letters resulting in medium quality Postscript Level-2: High-quality pattern filling Greater number of graphics primitives Color concept both device-dependent or device-independent Follow-up: Adobe’s PORTABLE DOCUMENT FORMAT (PDF)
GIF GIF(Graphics Interchange Format)是由CompuServe公司为了制定彩色图像传输协议而开发的图像格式文件。 具有支持64000像素的图像,256到16M颜色的调色板,单个文件的多重图像,按行扫描迅速解码,有效地压缩以及与硬件无关等特性。 GIF文件在存储时都经LZW压缩,可以将文件的大小压缩至20%-25%。 GIF可用于压缩复杂并极富变化的图像,因此适合于需要高效率的图像处理。目前,在因特网上,GIF格式已成为主页图片的标准格式。
TIFF TIFF(Tag Image File Format)称为标签图像文件格式。它是Alaus和Microsoft公司为扫描仪和桌面出版系统研制开发的较为通用的图像文件格式。 TIFF的存储格式可以压缩也可不压缩,压缩的方法也不只一种。 TIFF不依赖于操作环境,具有可移植性。它不仅作为图像信息交换的有效媒介,更可作为图像编辑程序的基本内部数据格式,具有多用性。 由于PC机和苹果MAC机同时支持TIFF格式,所以如果制作的图像同时要在PC机及苹果MAC机系统上应用的话,TIFF格式是个很好的选择。
XBM and XPM 在UNIX下存储程序图标或背景图像 不压缩 灰度、256彩色
example of the UNIX-world color images Some datails Hot spot: identifies cursor position where mouse selection can be applied Coded as string array (header and list of strings) Color substituted by ASCII value Transparency color: symbols (“s None”)
PBMplus PBM PGM PPM Anymap 文本/二进制
BMP BMP(Bitmap)文件是一种与设备无关的图像文件,是Windows软件推荐使用的一种格式,例如BMP文件用于作为Windows系统的图标和背景。 BMP是一种典型的位映射存储形式,可达24位全彩色模式。 为了处理方便,BMP文件都不压缩。
BMP图像文件结构 位图文件头(bitmap-file header) BITMAPFILEHEADER 位图信息头(bitmap-information header) BITMAPINFOHEADER 彩色表(color table) RGBQUAD 图像数据阵列字节BYTE
创建图形 输入设备 图形软件 Joystick Trackball Electromagnetic trackers Data glove 3D Mouse 图形软件 应用模板 应用程序 图形系统
存储图形 图形是用数学方法描述的一系列点、线、弧和其他几何形状。存储的数据主要是绘制图形的数学描述,用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。 在计算显示图时,也往往能看到画图的过程。绘制和显示这种图的软件通常称为绘图程序(draw programs)。 矢量图有许多优点。例如,当需要管理每一小块图像时,矢量图法非常有效;目标图像的移动、缩小放大、旋转、拷贝、属性的改变(如线条变宽变细、颜色的改变)也很容易做到;相同的或类似的图可以把它们当作图的构造块,并把它们存到图库中,这样不仅可以加速画的生成,而且可以减小矢量图文件的大小。 然而,当图变得很复杂时,计算机就要花费很长的时间去执行绘图指令。
IGES DXF:AutoCAD PGL:HP plotter WMF: Windows Metafile EMF: Enhanced metafile PIC: Variety of picture formats WRL: VRML 3DS: 3D Studio
3. Graphics & Image Processing 计算机图形(图像合成、产生):从基于计算机形式的模型到真实物体的图形合成。 图像处理(图像分析、识别):场景的分析、二维或3维物体图像的模型重建。 图像增强(Image improvement) 模式识别(Pattern detection and recognition)) 场景分析(Scene analysis) Computer vision
图像特性 颜色 统计图 颜色相关矢量 颜色空间 纹理 结构分析 统计纹理分析
CIE lab
边界 卷积模板 Sobel
图像分割 图象分割是将图象划分为若干互不相交的小区域的过程。 面向象素法 面向边界法 面向区域法
图像识别 规范:估计信息模型,压制噪声 标记:判定每个象素属于哪一个空间对象 分组:把属于同一对象的象素分组 抽取:为每组象素计算特征 匹配:解释图像对象
图像合成
4 重构图像
5 图形和图像的输出方案 Problem: Solution Main application: laser printer 5 图形和图像的输出方案 Problem: Image quality using binary images (black and white) Solution Dithering. Idea: human eye performs spatial integration. Machine representation: halftoning Main application: laser printer