Download presentation
Presentation is loading. Please wait.
1
多媒体技术基础(第3版) 第4章 彩色数字图像基础
2019年4月10日 多媒体技术基础(第3版) 第4章 彩色数字图像基础 张奇 复旦大学 计算机科学技术学院 2010年4月
2
第4章 彩色数字图像基础目录 4.1 视觉系统对颜色的感知 4.2 图像的颜色模型 4.3 图像的三个基本属性 4.4 图像的种类
2019年4月10日 第4章 彩色数字图像基础目录 4.1 视觉系统对颜色的感知 4.2 图像的颜色模型 4.2.1 显示彩色图像用RGB相加混色模型 4.2.2 打印彩色图像用CMY相减混色模型 4.3 图像的三个基本属性 4.3.1 图像分辨率 4.3.2 像素深度与阿尔法(α)通道 4.3.3 真彩色、伪彩色与直接色 4.4 图像的种类 4.4.1 矢量图与位图 4.4.2 灰度图与彩色图 4.5 伽马(γ)校正 4.5.1 γ的概念 4.5.2 γ校正 4.6 JPEG压缩编码 4.6.1 JPEG算法概要 4.6.2 JPEG算法的主要计算步骤 4.6.3 JPEG压缩和编码举例 4.7 图像文件格式 4.7.1 BMP文件格式 4.7.2 GIF文件格式 4.7.3 JPEG格式 4.7.4 PNG格式 参考文献和站点 2019年4月10日 第4章 彩色数字图像基础
3
背景 人们获取信息的70%来自视觉系统 图片信息很重要
4
压缩与颜色 图像数字化后的数据量非常大 因此就必须要对图像数据进行压缩 研究颜色 在网上传输时很费时间,在硬盘上存储时很占空间
比如在手机网络上传输、存储 因此就必须要对图像数据进行压缩 用比较少的数据量表达原始的图像。 研究颜色 了解人的视觉系统如何认识颜色、计算机系统中如何表示彩色图像从而更有效地减少数据量。
5
光 光的本质:电磁波 可见光:780nm~380nm 波长大于780纳米的电磁波是红外线,微波和广播无线电波。
波长小于380纳米的电磁波是紫外线,X-射线和宇宙射线。
6
可见光 颜色 波长 频率 红色 约625—740纳米 约480—405兆赫 橙色 约590—625纳米 约510—480兆赫 黄色
约565—570纳米 约530—510兆赫 绿色 约500—565纳米 约600—530兆赫 青色 约485—500纳米 约620—600兆赫 蓝色 约440—485纳米 约680—620兆赫 紫色 约380—440纳米 约790—680兆赫 可见光的光谱
7
颜色感知 颜色是视觉系统对可见光的感知结果
物体由于内部物质的不同,受光线照射后,一部分光线被吸收,其余的被反射或投射出来,成为我们所见的物体的颜色。所以,颜色既与光有密切关系,也与被光照射的物体,以及与观察者均有关。
8
感知颜色的原理 人眼的视觉功能 光的存在(光源色) 物体的表面特性(物体色)
9
眼睛 眼睛本质上是一个照相机。人的视网膜(human retina)通过神经元来感知外部世界的颜色,每个神经元或者是一个对颜色敏感的锥体(cone),或者是一个对颜色不敏感的杆状体(rod)。 视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞
10
颜色感知 红(L-cone)、绿(M-cone)和蓝(S-cone)三种锥体细胞对不同频率、不同亮度的光感知程度不同,人们可以使用数字图像处理技术来降低数据率而不感到图像质量明显下降。 各个波长的光的强度相等
11
色盲 色盲是指缺乏或完全没有辨别色彩的能力。 在人的视网膜上有一种感光细胞——锥细胞,它有红、绿、蓝3种感光色素。
每一种感光色素主要对一种原色光产生兴奋,而对其余两种原色光产生程度不等的反应。如果某一种色素缺乏,则会产生对此种颜色的感觉障碍,表现为色盲或色弱(辨色力弱)。
12
正常 缺少L-cone,红色盲 缺少S-cone,蓝黄色盲 缺少M-cone,绿色盲
13
色盲测试 男:8%, 女: 0.5%
14
4.1 视觉系统对颜色的感知(续) 视觉系统对颜色感知的特性 眼睛本质上是一个照相机
2019年4月10日 4.1 视觉系统对颜色的感知(续) 视觉系统对颜色感知的特性 眼睛本质上是一个照相机 人的视网膜(human retina)通过神经元感知外部世界的颜色,每个神经元是一个对颜色敏感的锥体(cone) 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同 这就意味着,人们可以使用数字图像处理技术来降低表示图像的数据量而不使人感到图像质量有明显下降。 从理论上说,自然界中的任何一种颜色都可以由R,G,B这三种颜色值之和来确定,它们构成一个三维的RGB矢量空间 这就是说,R,G,B的数值不同,混合得到的颜色就不同,也就是光波的波长不同 2019年4月10日 第4章 彩色数字图像基础
15
4.2 图像的颜色模型 显示彩色图像用RGB相加混色模型 一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定
2019年4月10日 4.2 图像的颜色模型 显示彩色图像用RGB相加混色模型 一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定 CRT使用3个电子枪分别产生红(red)、绿(green)和蓝(blue)三种波长的光,如图4-1所示,并以各种不同的相对强度组合产生不同的颜色 RGB相加混色模型 组合红、绿和蓝光波来产生特定颜色的方法叫做相加混色法(additive color mixture) ,即RGB相加混色模型 相加混色是计算机应用中定义颜色的基本方法 任何一种颜色都可用三种基本颜色按不同的比例混合得到 颜色=R(红的百分比)+G(绿的百分比)+B(蓝的百分比) 2019年4月10日 第4章 彩色数字图像基础
16
2019年4月10日 4.2 图像的颜色模型(续1) 三种颜色的光强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同。没有光到达眼睛,就是一片漆黑 当三基色等量相加时,得到白色;等量的红绿相加而蓝为0时得到黄色;等量的红蓝相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。这些三基色相加的结果如图4-2所示 图4-1 彩色显像产生颜色的原理 图4-2 相加混色 2019年4月10日 第4章 彩色数字图像基础
18
4.2 图像的颜色模型(续2) 彩色图像 一幅彩色图像可以看成是由许多的点组成的,如图4-3所示
2019年4月10日 4.2 图像的颜色模型(续2) 彩色图像 一幅彩色图像可以看成是由许多的点组成的,如图4-3所示 图像中的单个点称为像素(pixel),每个像素都有一个值,称为像素值,它表示特定颜色的强度 一个像素值通常用R,G,B三个分量表示。如果每个像素的每个颜色分量 “1”和“0”表示,即每种颜色的强度是100%或0%,每个像素显示的颜色是8种颜色之一,见表4-1 表4-1相加色 R G B 颜色 黑 1 蓝 绿 青 红 品红 黄 白 图4-3 一幅图像由许多像素组成 2019年4月10日 第4章 彩色数字图像基础
19
Lena RGB Image Red Channel Green Channel Blue Channel
20
4.2 图像的颜色模型(续3) 打印彩色图像用CMY相减混色模型 一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定用
2019年4月10日 4.2 图像的颜色模型(续3) 打印彩色图像用CMY相减混色模型 一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定用 用彩色墨水或颜料进行混合,绘制的图画是一种无源物体,用这种方法生成的颜色称为相减色 CMY相减混色模型 用三种基本颜色即青色(cyan)、品红(magenta)和黄色(yellow)的颜料按一定比例混合得到颜色的方法,通常写成CMY,称为CMY模型 从理论上说,任何一种颜色都可以用青色(cyan)、品红(magenta)和黄色(yellow)混合得到 用这种方法产生的颜色之所以称为相减混色,是因为它减少了为视觉系统识别颜色所需要的反射光 2019年4月10日 第4章 彩色数字图像基础
21
4.2 图像的颜色模型(续4) 在相减混色中, 当三基色等量相减时得到黑色;……。三基色相减结果如图4-4所示
2019年4月10日 4.2 图像的颜色模型(续4) 在相减混色中, 当三基色等量相减时得到黑色;……。三基色相减结果如图4-4所示 按每个像素每种颜色用1位表示,相减法产生的8种颜色如表4-3所示 表4-3 相减色 C(青色) M(品红) Y(黄色) 相减色 白 1 黄 品红 红 青 绿 蓝 黑 图4-4 相减混色 2019年4月10日 第4章 彩色数字图像基础
22
4.2 图像的颜色模型(续5) 相加色与相减色是互补色 相加混色和相减混色之间成对出现互补色, 见表4-4
2019年4月10日 4.2 图像的颜色模型(续5) 相加色与相减色是互补色 相加混色和相减混色之间成对出现互补色, 见表4-4 利用它们之间的关系,可把显示的颜色转换成打印的颜色 在RGB中的颜色值为1的地方,在CMY对应的位置上,其颜色值为0。例如,RGB为0∶1∶0时,对应CMY为1∶0∶1 表4-4 相加色与相减色的关系 相加混色(RGB) 相减混色(CMY) 生成的颜色 000 111 黑 001 110 蓝 010 101 绿 011 100 青 红 品红 黄 白 2019年4月10日 第4章 彩色数字图像基础
23
4.3 图像的三个基本属性 图像分辨率(resolution) 屏幕分辨率(screen resolution)
2019年4月10日 4.3 图像的三个基本属性 图像分辨率(resolution) 屏幕分辨率(screen resolution) 衡量显示设备再现图像时所能达到的精细程度的度量方法。也称显示分辨率 用“水平像素数×垂直像素数”表示,如640×480表示显示屏分成480行,每行显示640个像素,整个显示屏含有307200个显像点 常见的屏幕分辨率: 640×480,800×600,1024×768,1280×1024 传统电视屏幕的宽高比为4:3;高清晰度电视屏幕的宽高比为16∶9 图像分辨率(image resolution) 图像精细程度的度量方法。对同样尺寸的一幅图,如果像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越粗糙 图像分辨率也称空间分辨率(spatial resolution)和像素分辨率(pixel resolution) 2019年4月10日 第4章 彩色数字图像基础
24
4.3 图像的三个基本属性(续1) 在图像显示应用中的图像分辨率表示法 在图像数字化和打印应用中的图像分辨率表示法
2019年4月10日 4.3 图像的三个基本属性(续1) 在图像显示应用中的图像分辨率表示法 (1) 物理尺寸:每毫米线数(或行数) (2) 行列像素:像素/行×行/幅,如640像素/行×480行/幅 (3) 像素总数:如数码相机上标的500万像素 (4) 单位长度上的像素:如像素每英寸(pixels per inch,PPI) (5) 线对(line pair)数:以黑白相邻的两条线为一对,如5对线 在图像数字化和打印应用中的图像分辨率表示法 通常用多少点每英寸(dots per inch,DPI)表示,如300 DPI 分辨率越高,图像质量就越高,像素就越多,要求存储容量就越大 图像分辨率与屏幕分辨率是两个不同的概念 从行列像素角度看,图像分辨率是构成一幅图像的像素数目,而屏幕分辨率是显示图像的区域大小 2019年4月10日 第4章 彩色数字图像基础
25
4.3 图像的三个基本属性(续2) 像素深度与阿尔法(α)通道 存储每个像素所用的位数
2019年4月10日 4.3 图像的三个基本属性(续2) 像素深度与阿尔法(α)通道 存储每个像素所用的位数 例如,用R,G,B三个分量表示的彩色图像,若每个分量用8位表示,那么一个像素共用24位表示,就说像素深度为24位 像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数 例如,像素深度为24位时,每个像素可以是224= 种颜色中的一种 像素深度越深,表达的颜色数目就越多,所占用的存储空间也越大。相反,如果像素深度太浅,则影响图像的质量,图像看起来让人觉得很粗糙和很不自然 由于受到设备和人眼分辨率的限制,不一定要追求特别深的像素深度 2019年4月10日 第4章 彩色数字图像基础
26
4.3 图像的三个基本属性(续3) 阿尔法(α)通道
2019年4月10日 4.3 图像的三个基本属性(续3) 阿尔法(α)通道 在每个像素用32位表示的图像表示法中的高8位,其余24位是颜色通道,红色、绿色和蓝色分量各占一个8位的通道 用于表示像素在对象中的透明度 例如,用两幅图像A和B混合成一幅新图像,新图像(New)的像素为:New pixel =(alpha)(pixel A color) +(alpha)(pixel B color) 又如,一个像素(A,R,G,B)的四个分量都用规一化的数值表示时, 像素值为(1,1,0,0)时显示红色,表示红色强度为1 像素值为(0.5,1,0,0)时,使用α通道中的预乘数0.5与R,G,B相乘,其结果为(0.5,0.5,0,0),表示红色强度为0.5 2019年4月10日 第4章 彩色数字图像基础
27
4.3 图像的三个基本属性(续4) 真彩色、伪彩色与直接色 真彩色(true color) 伪彩色(pseudo color)
2019年4月10日 4.3 图像的三个基本属性(续4) 真彩色、伪彩色与直接色 真彩色(true color) 每个像素的颜色值用红(R)、绿(G)和蓝(B)表示的颜色 通常用24位表示,其颜色数224= 种。也称24位颜色(24-bit color)或全彩色(full color) 伪彩色(pseudo color) 不是物体固有的而是人为的颜色 将像素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,查找显示图像时要使用的R,G,B值,用查找出的R,G,B值产生的彩色 使用查找得到的R,G,B数值显示的彩色是真的,但不是图像本身真正的颜色,它没有完全反映原图的颜色 直接色(direct color) 每个像素值由R,G,B分量构成,每个分量作为单独的索引值对它做变换,用变换后的R,G,B值产生的颜色 2019年4月10日 第4章 彩色数字图像基础
28
真彩色 True Color 真彩色:指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度。
【例1】用RGB 5∶5∶5表示的彩色图像,R,G,B各用5位,用R,G,B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色。
29
真彩色 【例2】如果用RGB 8:8:8方式表示一幅彩色图像,就是R,G,B都用8位来表示,每个基色分量占一个字节,可生成的颜色数就是224= 种。 用3个字节表示的真彩色图像所需要的存储空间很大,而人的眼睛是很难分辨出这么多种颜色的 因此在许多场合往往用RGB 5:5:5来表示,每个彩色分量占5个位,再加1位显示属性控制位,共2个字节,生成的真颜色数目为215 = 32K。 全彩色(full color)图像:特指RGB 8:8:8,即图像的颜色数为224。
30
如何节省空间 分析图像中所有可能的颜色 假设为n种,通常 n<< 224 为每个色分配一个代码 每个代码对应有RGB值
每个颜色的bit数为 log2n 例如:图像最多有1000种色,那么用于表示一种颜色的bit数为 log21000 =10
31
伪彩色 Pseudo color 彩色查找表CLUT
每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表CLUT(color look-up table)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值。 彩色查找表CLUT 也称为:colormap(颜色图), palette(调色板) 是一个事先做好的表,表项入口地址也称为索引号,根据该索引号可查找出包含实际R、G、B的强度值。 例如16种颜色的查找表,0号索引对应黑色,... ,15号索引对应白色。
32
CLUT 彩色图像本身的像素数值和彩色查找表的索引号有一个变换关系,这个关系可以使用Windows 95/98定义的变换关系,也可以使用你自己定义的变换关系。 使用查找得到的数值显示的彩色本身是真的,但由于CLUT可能没有完全包含原图的所有可能彩色,故不一定反映图像原来真正的颜色 在VGA显示系统中,调色板就相当于颜色查找表
33
16色标准VGA调色板 绿色 伪彩色值=10 真彩色值=0 255 0 代码 R G B 颜色名称 效果 黑(Black) 1 128
黑(Black) 1 128 深蓝(Navy) 2 深绿(Dark Green) 3 深青(Dark Cyan) 4 深红(Maroon) 5 紫(Purple) 6 橄榄绿(Olive) 7 192 灰白(Light gray) 8 深灰(Dark gray) 9 255 蓝( blue) 10 绿( green) 11 青(cyan) 12 红( red) 13 品红( magenta) 14 黄(Yellow) 15 白(white) 绿色 伪彩色值=10 真彩色值=
34
真彩色和伪彩色图像之间的差别
35
调色板的选取 伪彩色一般用于65K色以下的显示方式中。标准的调色板是在256K色谱中按色调均匀地选取16种或256种颜色。
一般应用中,有的图像往往偏向于某一种或几种色调,此时如果采用标准调色板,则颜色失真较多。 因此,同一幅图像,采用不同的调色板显示可能会出现不同的颜色效果
36
例子 (调色板色彩数为16x16) 调色板与图像原有颜色匹配,故颜色偏差很小 调色板与原图不匹配,图像出现色偏 真彩色显示,无需调色板
37
CLUT Using the CLUT approach, We waste space for storing the CLUT.
We save space by using fewer bits for each pixel. Usually the latter factor outweighs the first.
38
直接色 Direct Color 每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。
39
真彩色与直接色的比较 相同之处是都采用R,G,B分量决定基色强度
不同之处是前者的基色强度直接用R,G,B决定,而后者的基色强度由R,G,B经变换后决定。产生的颜色有差别。 试验结果表明,使用直接色在VGA显示器上显示的彩色图像看起来真实、很自然,虽然只有256色。 VGA支持在640X480的较高分辨率下同时显示16种色彩或256种灰度,同时在320X240分辨率下可以同时显示256种颜色.
40
直接色与伪彩色的比较 相同之处是都采用查找表 不同之处是前者对R,G,B分量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换。
41
4.4 图像的种类 矢量图(vector graphics) 根据数学规则描述而生成的图 优点 局限性
2019年4月10日 4.4 图像的种类 矢量图(vector graphics) 根据数学规则描述而生成的图 一幅图用数学描述的点、线、弧、曲线、多边形和其他几何实体和几何位置来表示,创建的图是对象的集合而不是点或像素模式的图,如图4-5(a)所示 绘制和显示矢量图的软件通常称为绘图程序(draw programs);存放矢量图的存储格式称为矢量图格式;存储的数据主要是绘制图形的数学描述 优点 目标图像的移动、缩小或放大、旋转、拷贝、属性(如线条变宽变细、颜色)变更都很容易做到 相同或类似的图可以把它们当作图的构造块,并把它们存到图库中,这样不仅可加速矢量图的生成,而且可减小矢量图的文件大小 局限性 很难用数学方法来描述真实世界的彩照,这就要用位图法表示 2019年4月10日 第4章 彩色数字图像基础
42
2019年4月10日 4.4 图像的种类(续1) 图4-5 矢量图与位图 2019年4月10日 第4章 彩色数字图像基础
43
4.4 图像的种类(续2) 位图(bitmap,bitmapped image ) 用像素值阵列表示的图,如图4-5(b)所示 特性
2019年4月10日 4.4 图像的种类(续2) 位图(bitmap,bitmapped image ) 用像素值阵列表示的图,如图4-5(b)所示 对位图进行操作时,只能对图中的像素进行操作,而不能把位图中的物体作为独立实体进行操作。也称光栅图(raster graphics) 画位图或编辑位图的软件称为画图程序(paint programs);存放位图的格式称为位图格式;存储的内容是描述像素的数值 特性 位图的获取通常用扫描仪、数码相机、摄像机、录像机、视像光盘和相关的数字化设备 位图文件占据的存储空间比较大 影响位图文件大小的因素 图像分辨率:分辨率越高,表示组成一幅图的像素就越多,图像文件就越大 像素深度:像素深度越深,表达单个像素的颜色和亮度的位数越多,图像文件就越大 2019年4月10日 第4章 彩色数字图像基础
44
4.4 图像的种类(续3) 图形图像(graphical image ) 表示图形的位图,即用矢量图表示的图形转换成用像素表示的图像
2019年4月10日 4.4 图像的种类(续3) 图形图像(graphical image ) 表示图形的位图,即用矢量图表示的图形转换成用像素表示的图像 也称矢量图像(vector based image) 用像素值阵列表示的位图边沿较光滑;用矢量图转换成的位图边沿较粗糙 位图 图形图像 2019年4月10日 第4章 彩色数字图像基础
45
4.4 图像的种类(续4) 灰度图(gray-scale image或intensity image)
2019年4月10日 4.4 图像的种类(续4) 灰度图(gray-scale image或intensity image) 只有明暗不同的像素而没有彩色像素组成的图像 只有黑白两种颜色的图像称为单色图像(monochrome/bit image),如图4-6(a)所示 每个像素的像素值用一位存储,其值是“0”或“1” 用一个字节表示一个像素的灰度图(256级灰度)如图4-6(b)所示 一幅640×480的灰度图像需要占据300 KB的存储空间 图4-6 (a) 标准单色图 图4-6(b) 标准灰度图 2019年4月10日 第4章 彩色数字图像基础
46
4.4 图像的种类(续5) 彩色图像(color image) 每个像素包含颜色信息的图像。 可按照颜色的数目划分
2019年4月10日 4.4 图像的种类(续5) 彩色图像(color image) 每个像素包含颜色信息的图像。 可按照颜色的数目划分 256色图像(如图4-7):每个像素的R、G和B值用一个字节来表示,一幅640×480的彩色图像需要300 KB的存储空间 真彩色图像(如图4-8):每个像素的R,G,B分量分别用一个字节表示,一幅640×480的真彩色图像需要900 KB的存储空间 图 色标准图像 图4-8 24位标准图像 2019年4月10日 第4章 彩色数字图像基础
47
4.5 伽马( )校正 校正(gamma correction) 为补偿显示设备非线性的显示特性而采用的校正技术
2019年4月10日 4.5 伽马( )校正 校正(gamma correction) 为补偿显示设备非线性的显示特性而采用的校正技术 显示设备产生的光亮度与输入给它的电压之间呈现的关系为 光亮度 = (输入电压)γ 其中,γ是幂函数的指数,是一个常数,用来衡量非线性部件的转换特性 在把输入电压送到显示设备之前对它做一次变换,使输入到显示设备的电压′= (输入电压)γ ,这个变换称为校正 显示设备不同,γ的值也有所不同。阴极射线管(CRT)典型的值在2.25~2.45之间 2019年4月10日 第4章 彩色数字图像基础
48
2019年4月10日 4.5 伽马( )校正(续1) 2019年4月10日 第4章 彩色数字图像基础
49
4.6 JPEG压缩编码 JPEG是什么 Joint Photographic Experts Group的缩写,联合图像专家组
2019年4月10日 4.6 JPEG压缩编码 JPEG是什么 Joint Photographic Experts Group的缩写,联合图像专家组 由ISO和IEC两个组织机构联合组成的专家组,负责制定静态的数字图像数据压缩编码标准 JPEG标准 静态图像数据压缩标准,用于压缩灰度图像和彩色图像。两种基本压缩算法: 有损压缩算法:以离散余弦变换(DCT)为基础,在压缩比为25∶1的情况下,压缩后还原得到的图像与原始图像相比,非图像专家难于找出它们之间的区别 采用以预测技术为基础的无损压缩算法 JPEG格式 存放使用JPEG压缩的图像文件交换格式 大多数浏览器都支持这种格式的文件。以这种格式存放的图像文件的后缀是.JPG或.JFF。也称JFIF 2019年4月10日 第4章 彩色数字图像基础
50
4.6 JPEG压缩编码(续1) JPEG标准的文档 JPEG算法概要
2019年4月10日 4.6 JPEG压缩编码(续1) JPEG标准的文档 标准号:ISO/IEC IS 或ITU-T Recommendation T.81 标准名:Information technology — Digital compression and coding of continuous-tone still images (信息技术 — 连续色调静态图像的数字压缩和编码) JPEG算法概要 利用视觉系统特性,使用变换、量化和熵编码相结合的方法,以去掉或减少视觉的冗余信息和数据本身的冗余信息 JPEG算法框图如图4-9所示 图(a):压缩算法框图 图(b):解压缩算法框图 2019年4月10日 第4章 彩色数字图像基础
51
4.6 JPEG压缩编码(续2) 图4-9 JPEG压缩-解压缩算法框图 2019年4月10日 2019年4月10日
第4章 彩色数字图像基础
52
2019年4月10日 第4章 彩色数字图像基础
53
2019年4月10日 第4章 彩色数字图像基础
54
2019年4月10日 第4章 彩色数字图像基础
55
2019年4月10日 第4章 彩色数字图像基础
56
2019年4月10日 第4章 彩色数字图像基础
57
2019年4月10日 第4章 彩色数字图像基础
58
2019年4月10日 第4章 彩色数字图像基础
59
2019年4月10日 第4章 彩色数字图像基础
60
2019年4月10日 第4章 彩色数字图像基础
61
2019年4月10日 第4章 彩色数字图像基础
62
2019年4月10日 第4章 彩色数字图像基础
63
2019年4月10日 第4章 彩色数字图像基础
64
2019年4月10日 第4章 彩色数字图像基础
65
2019年4月10日 第4章 彩色数字图像基础
66
2019年4月10日 第4章 彩色数字图像基础
67
4.6 JPEG压缩编码(续3) JPEG标准的压缩算法大致分成三个步骤: JPEG算法与颜色空间无关
2019年4月10日 4.6 JPEG压缩编码(续3) JPEG标准的压缩算法大致分成三个步骤: 使用正向离散余弦变换(FDCT)把空间域表示的图变换成频率域表示的图 使用加权函数对DCT系数进行量化,加权函数对人的视觉系统是最佳的 使用霍夫曼编码器对量化系数进行编码 JPEG算法与颜色空间无关 RGB和YUV之间的变换不包含在JPEG算法中 JPEG算法处理单独的图像彩色分量,因此可压缩来自不同颜色空间的数据,如RGB, YCbCr, CMYK 2019年4月10日 第4章 彩色数字图像基础
68
4.6 JPEG压缩编码(续4) 离散余弦变换(DCT) discrete cosine transform的缩写
2019年4月10日 4.6 JPEG压缩编码(续4) 离散余弦变换(DCT) discrete cosine transform的缩写 用余弦函数的离散值构成的变换矩阵对信号的一系列样本值进行运算的数学变换 可将能量集中到频率较低的系数上 将分量图像分成8×8的图块,如图4-10所示 图4-10 离散余弦变换 2019年4月10日 第4章 彩色数字图像基础
69
4.6 JPEG压缩编码(续5) DCT变换使用下式计算 逆变换使用下式计算 当u,v=0; 其中, 其他 2019年4月10日
第4章 彩色数字图像基础
70
4.6 JPEG压缩编码(续6) 二维DCT的计算 当计算精度足够高时,DCT变换不会损失图像质量 图4-11 二维DCT变换方法
2019年4月10日 4.6 JPEG压缩编码(续6) 二维DCT的计算 将二维DCT变成一维DCT,如图4-11所示 实际的快速计算方法可参看参考文献[C. Loeffler] 当计算精度足够高时,DCT变换不会损失图像质量 图4-11 二维DCT变换方法 2019年4月10日 第4章 彩色数字图像基础
71
4.6 JPEG压缩编码(续7) 量化 对FDCT变换后的(频率的)系数进行量化 量化目的是降低非“0”系数的幅度以及增加“0”值系数的数目
2019年4月10日 4.6 JPEG压缩编码(续7) 量化 对FDCT变换后的(频率的)系数进行量化 量化目的是降低非“0”系数的幅度以及增加“0”值系数的数目 用图4-12所示的均匀量化器量化 量化是造成图像质量下降的最主要原因 量化用右式计算 图4-12 均匀量化器 2019年4月10日 第4章 彩色数字图像基础
72
4.6 JPEG压缩编码(续8) 量化步距 按照系数所在的位置和每种颜色分量的色调值来确定的
2019年4月10日 4.6 JPEG压缩编码(续8) 量化步距 按照系数所在的位置和每种颜色分量的色调值来确定的 因为人眼对亮度信号比对色差信号更敏感,因此使用两种量化表:如表4-6所示的亮度量化表和表4-7所示的色差量化表 由于人眼对低频分量的图像比对高频分量的图像更敏感,因此表中的左上角的量化步距要比右下角的量化步距小 表4-6和表4-7中的数值对CCIR 601标准电视图像已经是最佳的 如果不使用这两种表,用户也可以用自己的量化表替换它们 2019年4月10日 第4章 彩色数字图像基础
73
4.6 JPEG压缩编码(续9) 表4-6 亮度量化表 表4-7 色差量化表 16 11 10 24 40 51 61 12 14 19
2019年4月10日 4.6 JPEG压缩编码(续9) 表4-6 亮度量化表 表4-7 色差量化表 16 11 10 24 40 51 61 12 14 19 26 58 60 55 13 57 69 56 17 22 29 87 80 62 18 37 68 109 103 77 35 64 81 104 113 92 49 78 121 120 101 72 95 98 112 100 99 17 18 24 47 99 21 26 66 56 2019年4月10日 第4章 彩色数字图像基础
74
4.6 JPEG压缩编码(续10) Z字形编排 为增加连续的“0”值系数的个数,即“0”的游程长度,如图4-13所示
2019年4月10日 4.6 JPEG压缩编码(续10) Z字形编排 为增加连续的“0”值系数的个数,即“0”的游程长度,如图4-13所示 DCT系数的序号如图4-14所示,序号小的位置表示频率较低,把一个8 8的矩阵变成一个1 64的矢量 图4-14 DCT系数序号 图4-13 量化DCT系数的编排 2019年4月10日 第4章 彩色数字图像基础
75
4.6 JPEG压缩编码(续11) 熵编码 用于进一步压缩采用DPCM编码后的DC系数差值和RLE编码后的AC系数
2019年4月10日 4.6 JPEG压缩编码(续11) 熵编码 用于进一步压缩采用DPCM编码后的DC系数差值和RLE编码后的AC系数 先将8×8图像块的DC系数和63个AC系数用中间符号表示,中间符号由两个符号组成 一个符号是表示数据大小的可变长度码(variable-length code,VLC),用的代码是霍夫曼码 一个符号是直接表达实际幅度的可变长度整数(variable-length integer,VLI) 由于DC系数和AC系数的统计特性不同,因此在熵编码时需要对DC系数和AC系数分别处理 用霍夫曼编码器 理由是可用简单的查表(lookup table)方法进行编码 霍夫曼编码器对出现频度比较高的符号分配比较短的代码,而对出现频度较低的符号分配比较长的代码 这种可变长度的霍夫曼码表可事先定义 2019年4月10日 第4章 彩色数字图像基础
76
2019年4月10日 4.6 JPEG压缩编码(续12) 2019年4月10日 第4章 彩色数字图像基础
77
4.7 图像文件格式 图像文件格式是存储图形或图像数据的数据结构 BMP文件格式 bitmap的简写
2019年4月10日 4.7 图像文件格式 图像文件格式是存储图形或图像数据的数据结构 BMP文件格式 bitmap的简写 微软公司开发的在Windows环境下的标准位图文件格式 与设备无关的位图(DIB)文件格式 device-independent bitmap的缩写 像素存储顺序和像素深度与具体设备无关 文件扩展名是.BMP或.bmp 2019年4月10日 第4章 彩色数字图像基础
78
4.7 图像文件格式(续1) 文件结构 BMP位图文件可看成由4个部分组成 数据结构各部分的名称见表4-14 表4-14 BMP图像文件结构
2019年4月10日 4.7 图像文件格式(续1) 文件结构 BMP位图文件可看成由4个部分组成 位图文件头(bitmap-file header) 位图信息头(bitmap-information header) 彩色表(color table) 位图的字节(byte)阵列 数据结构各部分的名称见表4-14 表4-14 BMP图像文件结构 组成部分的名称 数据结构的名称 位图文件头(bitmap-file header) BITMAPFILEHEADER 位图信息头(bitmap-information header) BITMAPINFOHEADER 彩色表(color table) RGBQUAD 图像数据阵列字节(byte) BYTE 2019年4月10日 第4章 彩色数字图像基础
79
4.7 图像文件格式(续2) GIF格式——图形文件交换格式 Graphics Interchange Format的缩写
2019年4月10日 4.7 图像文件格式(续2) GIF格式——图形文件交换格式 Graphics Interchange Format的缩写 CompuServe公司开发的图像文件存储格式 1987年开发的版本号为GIF87a 1989年扩充后的版本号为GIF89a。 图像的相关信息以数据块(block)为单位 一个GIF文件由表示图形/图像的数 据块、数据子块以及显示图形/图像的控制信息块组成 在一个文件中可存放多幅彩色图形/图像,并可像幻灯片那样显示或像动画那样演示 采用LZW压缩算法来压缩图像数据 用户可为图像设置透明(transparency)的背景 2019年4月10日 第4章 彩色数字图像基础
80
4.7 图像文件格式(续3) JPEG格式 Joint Photographic Experts Group的缩写
2019年4月10日 4.7 图像文件格式(续3) JPEG格式 Joint Photographic Experts Group的缩写 JPEG委员会在制定JPEG标准时定义了许多标记(marker),用来区分和识别图像数据及其相关信息 广泛使用的JPEG文件格式是JPEG文件交换格式(JPEG File Interchange Format,JFIF),版本号为1.02,这是1992年9月由在C-Cube Microsystems公司工作的Eric Hamilton提出的 由于JFIF文件格式直接使用JPEG标准为应用程序定义的许多标记,因此JFIF格式就成了事实上的JPEG文件交换格式标准 2019年4月10日 第4章 彩色数字图像基础
81
4.7 图像文件格式(续4) PNG格式——便携网络图形格式 Portable Network Graphic Format的简称
2019年4月10日 4.7 图像文件格式(续4) PNG格式——便携网络图形格式 Portable Network Graphic Format的简称 20世纪90年代中期开始开发的图像文件存储格式,其目的是企图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性 名称来源于非官方的“PNG‘s Not GIF”,是一种位图文件(bitmap file)存储格式 用来存储灰度图像时,灰度图像的深度可多达16位,存储彩色图像时,彩色图像的深度可多达48位,并且还可存储多达16位的α通道数据 PNG使用从LZ77派生的数据无损压缩算法 2019年4月10日 第4章 彩色数字图像基础
82
4.7 图像文件格式(续5) 保留的GIF文件格式特性 使用彩色查找表或称调色板,支持256种颜色的彩色图像
2019年4月10日 4.7 图像文件格式(续5) 保留的GIF文件格式特性 使用彩色查找表或称调色板,支持256种颜色的彩色图像 流式读/写性能(streamability):允许连续读出和写入图像数据,这个特性很适合于在通信过程中生成和显示图像 逐次逼近显示(progressive display):可使在通信链路上传输图像文件的同时就在终端上显示图像,把整个轮廓显示出来之后逐步显示图像的细节,也就是先用低分辨率显示图像,然后逐步提高它的分辨率 透明性(transparency):可使图像中某些部分不显示,以创建一些有特色的图像 辅助信息(ancillary information):可用来在图像文件中存储一些文本注释信息 独立于计算机软硬件环境 使用无损压缩。 2019年4月10日 第4章 彩色数字图像基础
83
4.7 图像文件格式(续6) 增加的GIF文件格式所没有的特性: 每个像素为48位的真彩色图像 每个像素为16位的灰度图像
2019年4月10日 4.7 图像文件格式(续6) 增加的GIF文件格式所没有的特性: 每个像素为48位的真彩色图像 每个像素为16位的灰度图像 可为灰度图和真彩色图添加α通道 添加图像的γ信息 使用循环冗余码(cyclic redundancy code,CRC)检测损害的文件 加快图像显示的逐次逼近显示方式。 标准的读/写工具包 2019年4月10日 第4章 彩色数字图像基础
84
2019年4月10日 第4章 彩色数字图像基础 参考文献和站点 Natravali,A.N.and Haskell,B.G., Digital Pictures-Representation and Compression. Plenum Press,New York and London,1988 ISO/IEC JTC 1. DIS ,Digital Compression and Coding of Continuous-Tone still Image Part 1,Requirements and Guidelines. July 1992 γ校正: Wallace,G.,The JPEG still Picture Compression Standard. Communications of the ACM,Vol.34,No.4,Apr.1991 C. Loeffler, A. Ligtenberg and G. Moschytz. Practical Fast 1-D DCT Algorithms with 11 Multiplications. Proc. Int'l. Conf. on Acoustics, Speech, and Signal Processing, 1989 (ICASSP’ 89), pp 各种文件格式参考站点: (1) 包含各种图像文件格式规范等的站点: (2) PNG (Portable Network Graphics)格式站点: 张维谷,小宇宙工作室著. 林福宗改编. 图像文件格式(上、下)—Windows编程. 北京:清华大学出版社出版,1996年9月 Eric Hamilton, JPEG File Interchange Format, Version 1.02, September 1, 1992, C-Cube Microsystems 2019年4月10日 第4章 彩色数字图像基础
85
2019年4月10日 END 第4章 彩色数字图像基础
Similar presentations