2 数字图像基础 赵国庆 博士 guoqingzh@163.com 北京师范大学教育技术学院 http://set.bnu.edu.cn 北京师范大学知识科学与工程研究所 http://ksei.bnu.edu.cn
内容提要
1 颜色及色彩模型
颜色的形成原理——光的本质 从本质上讲,光是一种电磁波.
颜色的形成原理——光的本质 颜色是视觉系统对可见光的感知结果。 我们通常所说的光是指可见光,它们是波长在380nm-780nm之间的电磁波。 在自然界中,人们看到的大多数光不是单一波长的波,而是由多种不同波长的波组合而成的。我们将光谱中不能再分解的光称为单色光,由单色光组合而成的光称为复色光。 常见的光的波长与颜色的对应关系如表所示。 颜色 红 橙 黄 绿 青 蓝 紫 波长(nm) 700 620 580 546 480 436 380
颜色的形成原理——光的本质 人们获取的信息的70%来自视觉系统 研究表明,人的视网膜有对红(Red)、绿( Green)、蓝(Blue)颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状细胞,因此颜色只存在于眼睛和大脑。 由于红、绿、蓝三种颜色可以混合而成自然界的任何一种颜色,因此被称为三基色。
颜色的形成原理 人的视觉系统对颜色的感知可归纳出如下几个特性: 眼睛本质上是一个照相机 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同 自然界中的任何一种颜色都可以由R、G、B这3种颜色值之和来确定。
颜色三要素 色彩可以用色调、亮度和饱和度来描述。人眼看到的任何一种颜色都是都三个特性的综合效果。因此这三个特性被称为色彩的三要素。 三要素中,色调由光波的波长决定,亮度和饱和度与光波的振幅有关。
颜色三要素——色调 色调表示光的颜色,决定于光的波长。自然界中的七色光分别对应着不同的色调,而每种色调又分别对应着不同的波长。 色调用红、橙、黄、绿、青、蓝、紫来表示,而黑、白、灰无色彩。 色调有一个基本顺序:红(Red)、橙(Orange)、黄(Yellow)、绿(Green)、青(Cyan)、蓝(Blue)、紫(Magenta)。在这个次序中,人们混合相邻颜色时,能够得到这两种颜色之间连续变化的色调。
颜色三要素——色调(2) 按照不同的色调按红、橙、黄、绿、青、蓝、紫的顺序衔接起来,就形成了一个色调连续变化过渡的圆环,称为色环。 以色环的中心为极坐标极点,各种色调与极轴的夹角称为色调的色相。 例如红色的色相为0度,红、绿、蓝三基色的夹角为120度,黄色(=红+绿)的色相为60度,正好位于红色和绿色之间。
颜色三要素——亮度 亮度用来表示某种颜色在人眼视觉上引起的明暗程度,它只与光的强度有关。 光的强度越大,物体就越亮;光的强度越小,物体就越暗。 在纯正光谱的七色光中,黄色的亮度最高,显得最亮,往下依次是橙色、绿色、红色、蓝色、紫色。
颜色三要素——饱和度 饱和度是指彩色光所呈现颜色的深浅或纯洁程度。 对于同一色调的彩色光,饱和度越高,颜色就越纯;饱和度越低,颜色就越浅。 在彩色光中加入白光,基本色调没有变化,但亮度提高了,饱和度却下降了。 因此,在某色调的彩色光中加入别的彩色光,会引起色调的变化;而掺入白光仅仅引起饱和度的变化。
图像的色彩模型 色彩模型是用来精确标定和生成各种颜色的一套规则和定义。不同的应用又有不同的色彩模型,最常用的色彩模型有RGB、CMYK、HSB、YUV以及Lab色彩模型。其中RGB、CMYK是两种专门面向数码设计和出版印刷的色彩模型。 一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,使用RGB相加混色模型; 一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用CMY相减混色模型。
RGB相加混色模型 电视机和计算机显示器使用的阴极射线管(CRT)是一个有源物体。CRT使用3个电子枪分别产生红(Red)、绿(Green)和蓝(Blue)三种波长的光,并以各种不同的相对强度综合起来产生颜色。
LCD与CRT 电脑显示器包括两种: 液晶LCD(liquid crystal display) 阴极射线管CRT 电脑CRT显示器类似于彩色电视机中的CRT。显示屏上的每个彩色像点由代表R、G、B三种模拟信号的相对强度决定,这些彩色像点就构成一幅彩色图像。
彩色显像管产生颜色的原理
RGB相加混色模型 从理论上讲,任何一种颜色都可用三种基本颜色按不同的比例混合得到。三种颜色的光强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同,没有光到达眼睛,就是一片漆黑。当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜色。某一种颜色和这三种颜色之间的关系可用下面的式子来描述: 颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)
RGB相加混色模型 Red(红) + Green(绿)= Yellow(黄) Red (红) +Blue(蓝)= Magenta(品红) Green (绿) + Blue (蓝) = Cyan (青)
CMYK相减混色模型 用彩色墨水或颜料进行混合,这样得到的颜色称为相减色。 在理论上说,任何一种颜色都可以用三种基本颜料按一定比例混合得到。这三种颜色是青色(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY,称为CMY模型。 理论上,当青色 (C)、洋红 (M) 和黄色 (Y) 色素在合成后可以吸收所有光线并产生黑色。但由于所有的打印油墨都存在一些杂质,这三种油墨实际会产生土棕色。因此,在四色打印中除了使用纯青色、洋红和黄色油墨外,还会使用黑色油墨 (K)。(为避免与蓝色混淆,黑色用 K 而非 B 表示。)因此,该模型通常写成CMYK,称为CMYK相减混色模型。
CMYK相减混色模型 在相减混色中,当三基色等量相减时得到黑色; (为什么?) 等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);(为什么?) 等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B); (为什么?) 等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。 (为什么?)
CMYK相减混色模型
RGB模型与CMYK模型的区别 第一,RGB色彩模式是发光的,存在于屏幕等显示设备中,不存在于印刷品中;CMYK色彩模式是反光的,需要外界辅助光源才能被感知,它是印刷品唯一的色彩模式。 第二,色彩数量上RGB色域的颜色数比CMYK多出许多。但两者各有部分色彩是互相独立(即不可转换)的。 第三,RGB通道灰度图中偏白表示发光程度高;CMYK通道灰度图中偏白表示油墨含量低。反而反之。
RGB模型与CMYK模型的区别(2) 特别注意第二条:两者各有部分色彩是互相独立(即不可转换)的。 如右图中绿色大圆表示RGB色域,蓝色小圆表示CMYK色域。这一大一小表示RGB的色域范围(即色彩数量)要大于CMYK。而在转换色彩模式后,只有位于混合区的颜色彩可以被保留,位于RGB特有区及CMYK特有区的颜色将丢失。
RGB模型与CMYK模型的选择 虽然理论上RGB与CMYK的互转都会损失一些颜色,不过从CMYK转RGB时损失的颜色较少,在视觉上有时很难看出区别。而从RGB转CMYK颜色将损失较多,视觉大部分都可以明显分辨出来。因此习惯上也有CMYK转RGB时颜色无损的说法,其实这种说法的真正所指是:宁可CMYK转RGB,不可RGB转CMYK。 明白了以上道理,我们对如何选择图像的色彩模式就有了一个概念了:如果图像只在电脑上显示,就用RGB模式,这样可以得到较广的色域;如果图像需要打印或者印刷,就必须使用CMYK模式,才可确保印刷品颜色与设计时一致。
活动任务 任务1:通过Photoshop体验颜色三要素(色调、亮度、饱和度) 任务2:调整颜色通道,让图片的颜色更加鲜艳 效果图 原图
2 图像的数字化
图像的数字化 计算机只能处理数字化的图像。 自然界中的景物成像后无论以何种记录介质保存都是连续的。从空间上看,一幅图像在二维空间上都是连续分布的,从空间的某一点位置的亮度来看,亮度值也是连续分布的。 图像数字化就是把连续的空间位置和亮度离散,它包括两个方面的内容:空间位置的离散和数字化,亮度值的离散和数字化。 图像的数字化过程包括采样、量化和编码三个阶段。
①采样 把一幅连续的图像在二维方向上分成m×n个网格,每个网格用一个亮度值表示,这样一幅图像就要用m×n个亮度值表示,这个过程称为采样。
①采样 图像中的每个像素都有一个值,称为像素值,它表示特定颜色的强度。 一个像素值往往用R、G、B三个分量表示。 如果每个像素的每个颜色分量用二进制的1位来表示,那么每个颜色的分量只有“1”和“0”这两个值。 这也就是说,每种颜色的强度是100%,或者是0%。在这种情况下,每个像素所显示的颜色是8种可能出现的颜色之一。
8色 RGB 颜色 000 黑 001 蓝 010 绿 011 青 RGB 颜色 100 红 101 品红 110 黄 111 白
量化和编码 ②量化。采样的图像亮度值,在采样的连续空间上仍然是连续值。把亮度分成k个区间,某个区间对应相同的亮度值,共有k个不同的亮度值,这个过程称为量化。 ③编码。对每个像素的亮度值采用相应的二进制数来表示,这个过程称为编码。
图像数字化的指标 影响图像数字化质量的主要参数有分辨率、像素深度。分辨率、像素深度和色彩类型一起构成了数字图像的三大基本属性。 分辨率是位图图像的重要参数。我们经常遇到的分辨率有三种:显示分辨率、图像分辨率和像素分辨率。
图像分辨率 图像分辨率是指组成一幅图像的像素密度的度量方法。 对同样大小的一幅图,如果组成该图的图像像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越粗糙。 在用扫描仪扫描彩色图像时,通常要指定图像的分辨率,用每英寸多少点表示,即DPI(dots per inch)。如果用300DPI来扫描一幅8″×10″的彩色图像,就得到一幅2400×3000个像素的图像。分辨率越高,像素就越多。
显示分辨率 图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是指显示屏上能够显示出的像素数目。 屏幕能够显示的像素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。 例如,显示分辨率为640×480表示显示屏分成480行,每行显示640个像素,整个显示屏就含有307200个显像点。 如果显示屏的分辨率为640×480,那么一幅320×240的图像只占显示屏的1/4;相反,2400×3000的图像在这个显示屏上就不能显示一个完整的画面。
像素分辨率 像素分辨率是指显像管荧光屏上一个像素点的宽和长之比。 例如:在捕捉图像时,如果显像管的象素分辨率为2:1,而产生图像的显像管的象素分辨率为1:1,这时该图像会发生变形。
像素深度 像素深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。 像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。
像素深度 例如,一幅彩色图像的每个像素用R、G、B三个分量表示,若每个分量用8位,那么一个像素共用24位表示,就说像素的深度为24,每个像素可以是224=16 777 216种颜色中的一种。 在这个意义上,往往把像素深度说成是图像深度。表示一个像素的位数越多,它能表达的颜色数目就越多,而它的深度就越深。
色彩类型:真彩色、伪彩色与直接色 图像的色彩需要用三维空间来表示,如RGB色彩模型,而色彩的空间表示法又不是唯一的,所以每个像素点的像素深度的分配还与图像的色彩类型有关。 以常见的RGB色彩模型为例,像素深度与色彩的映射关系主要有真彩色、伪彩色和直接色。
真彩色 真彩色是指在组成一幅彩色图像的每个像素值中,有R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。 例如用RGB 5∶5∶5表示的彩色图像,R、G、B各用5位,用R、G、B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色。
真彩色 如果用RGB 8:8:8方式表示一幅彩色图像,就是R、G、B都用8比特来表示,每个基色分量占一个字节,共3个字节,每个像素的颜色就是由这3个字节中的数值直接决定,可生成的颜色数就是224 =16 777 216种。
真彩色 用3个字节表示的真彩色图像所需要的存储空间很大,而人的眼睛是很难分辨出这么多种颜色的,因此在许多场合往往用RGB 5:5:5来表示,每个彩色分量占5个比特,再加1比特显示属性控制位共2个字节,生成的真颜色数目为215 = 32K。
伪彩色 伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表CLUT(color look-up table)的表项入口地址,去查找一个显示图像时使用的R、G、B强度值,用查找出的R、G、B强度值产生的彩色称为伪彩色。
伪彩色 彩色查找表CLUT(color look up table)是一个事先做好的表,表项入口地址也称为索引号。例如16种颜色的查找表,0号索引对应黑色,... ,15号索引对应白色。彩色图像本身的像素数值和彩色查找表的索引号有一个变换关系。
直接色 每个像素值分成R、G、B分量,每个分量作为单独的索引值对它做变换,也就是通过相应的彩色变换表找出基色强度,用变换后得到的R、G、B强度值产生的彩色称为直接色。 它的特点是对每个基色进行变换。
直接色与真彩色、伪彩色的比较 直接色与真彩色相比,相同之处是都采用R、G、B分量决定基色强度,不同之处是前者的基色强度直接用R、G、B决定,而后者的基色强度由R、G、B经变换后决定。因而这两种系统产生的颜色就有差别。试验结果表明,使用直接色在显示器上显示的彩色图像看起来真实、很自然。 直接色与伪彩色系统相比,相同之处是都采用查找表,不同之处是前者对R、G、B分量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换。
活动任务 任务1:观察位图的像素点。 任务2:抓图体验图像分辨率与显示分辨率
3 数字图像的分类
图像的种类 按照图像的几何特性,可以将图像分为点阵图和矢量图两大类。 按照图像的颜色,可以将图像分为彩色图和灰度图两大类。
矢量图与点阵图(位图) 在计算机中,表达图像和计算机生成的图形图像有两种常用的方法:一种叫做是矢量图(vector based image)法,另一种叫点阵图(bit mapped image)法。 虽然这两种生成图的方法不同,但在显示器上显示的结果几乎没有什么差别。
矢量图(图形) 图形(Graphic)是指从点、线、面到三维空间的黑白或彩色几何图。 图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。 在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。
点阵图(位图/图像) 图像(Image)是由像素点阵组成的画面。 静止的图像是一个矩阵,阵列中的各项数字用来描述构成图像的各个点(称为像素点 pixel )的强度与颜色等信息。这种图像也称为位图( bit-mapped picture )。
矢量图与点阵图的比较 位图文件占据的存储器空间比较大。影响点位图文件大小的因素主要有两个:图像分辨率和像素深度。 分辨率越高,就是组成一幅图的像素越多,则图像文件越大;像素深度越深,就是表达单个像素的颜色和亮度的位数越多,图像文件就越大。 而矢量图文件的大小则主要取决于图的复杂程度。
矢量图与点阵图的比较(2) 矢量图与位图相比,显示位图文件比显示矢量图文件要快; 矢量图侧重于“绘制”、去创造,而位图偏重于“获取”、去“复制”; 矢量图和位图之间可以用软件进行转换,由矢量图转换成点位图采用光栅化(rasterizing)技术,这种转换也相对容易;由点位图转换成矢量图用跟踪(tracing)技术,这种技术在理论上说是容易,但在实际中很难实现,对复杂的彩色图像尤其如此。
灰度图 灰度图(gray-scale image)按照灰度等级的数目来划分。 只有黑白两种颜色的图像称为单色图像(monochrome image)。图中的每个像素的像素值用1比特存储,它的值只有“0”或者“1”,一幅640×480的单色图像需要占据37.5 KB的存储空间。
标准单色图和标准灰度图
彩色图像 彩色图像(color image)可按照颜色的数目来划分,例如256色图像和真彩色(224=16 777 216种颜色)等。
256色标准图像转换成的256级灰度图像
256色标准图像转换成的256级灰度图像 上图是一幅用256色标准图像转换成的256级灰度图像 256色彩色图像的每个像素的R、G和B值用一个字节来表示,一幅640×480的8比特彩色图像需要307.2 KB的存储空间; (640×480×1=307200byte) (这副彩色图像是真彩色还是伪彩色?)
真彩色图像转换成的256级灰度图像
真彩色图像转换成的256级灰度图像 上图是一幅真彩色图像转换成的256级灰度图像,每个像素的R、G、B分量分别用一个字节表示,一幅640×480的真彩色图像需要921.6 KB的存储空间。 (640×480×3=921600byte)
32位真彩色 许多24比特彩色图像是用32比特存储的,这个附加的8比特叫做alpha通道,它的值叫做alpha值,它用来表示该像素如何产生特技效果。 使用真彩色表示的图像需要很大的存储空间,在网络传输也很费时间。由于人的视角系统的颜色分辨率不高,因此在没有必要使用真彩色的情况下就尽可能不用。
4 数字图像的存储
图像数据量 图像数据量是指磁盘上存储整幅图像所需的字节数。图像数据量的计算表达式为: 图像数据量=图像分辨率×像素深度/8(byte) 例如: 一幅640×480的256级灰度图像, 未压缩的原始数据量=640×480×8/8(byte)=307200byte=307200/1024KB=300KB。 一幅1024×768的真彩色图像,未压缩的原始数据量=1024×768×24/3(byte)=2359296byte=2.25M。
图象的压缩 从上面计算的结果可以看出,图像数字化之后的数据量非常大,在因特网上传输时很费时间,在盘上存储时很占“地盘”,因此就必须要对图像数据进行压缩。 压缩的目的就是要满足存储容量和传输带宽的要求,而付出的代价是大量的计算。
图像的压缩 图像数据压缩主要根据下面两个基本事实来实现的。 一个是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量; 另一个事实是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到压缩数据的目的。 利用前一个事实的压缩技术就是无损压缩技术,利用后一个事实的压缩技术就是有损压缩技术。 实际的图像压缩是综合使用各种有损和无损压缩技术来实现的
图像文件格式 BMP格式 GIF格式 JPG格式 PNG格式 PSD格式 ……
BMP格式(相对文件较大) BMP是一种与硬件设备无关的图像文件格式,使用非常广。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选1bit、4bit、8bit及24bit。 BMP是最普遍的位图格式之一,也是Windows系统下的标准格式。BMP格式支持RGB。索引颜色、灰度和位图颜色模式,不支持Alpha通道。
GIF格式 GIF是一种压缩的8位图像文件,广泛用于网络传输,最多只有256色。 新的 GIF89a格式,能储存成背景透明化的形式(支持 Alpha通道),并且可以将数张图存成一个文件,形成动画效果,还支持位图模式、灰度或索引颜色模式图像。
JPEG格式 JPEG是一种高效率的压缩格式,在存档时能够将人眼无法分辨的资料删除,以节省存储空间。 JPEG格式支持RGB和灰度颜色模式,不支持Alpha通道。JPEG格式通过选择性地去掉数据来压缩文件,是有损压缩。它比GIF图像包含更多颜色方面的信息,优点是色彩比较逼真,文件也较小。在多媒体及网页中用到的照片和图像适合存为JPEG格式。
活动任务 抓图计算图像数据量。 如何抓图? 按Print Screen SysRq键 打开画图(开始→程序→附件→画图) Ctrl+V粘贴 保存
Hyper Snap 如何抓图? 如何编辑?
实验内容 抓图并计算文件大小 图像调整 抓图 存成不同的格式,观察效果 计算不同的格式文件的大小,与实际大小进行比较 色调调整 亮度调整 饱和度调整
2 数字图像基础 赵国庆 博士 guoqingzh@163.com 北京师范大学教育技术学院 http://set.bnu.edu.cn 北京师范大学知识科学与工程研究所 http://ksei.bnu.edu.cn