Presentation is loading. Please wait.

Presentation is loading. Please wait.

MTI 多媒体技术 第五讲 XIDIAN 彩色数字图像基础.

Similar presentations


Presentation on theme: "MTI 多媒体技术 第五讲 XIDIAN 彩色数字图像基础."— Presentation transcript:

1 MTI 多媒体技术 第五讲 XIDIAN 彩色数字图像基础

2 主要内容 视觉系统对颜色的感知 图像的颜色模型 图像的基本属性 图像的分类 伽马()校正 常用图像文件格式

3 视觉系统对颜色的感知 可见光的波长范围为380nm~780nm,大多数自然光都是由不同波长的光组合而成。
人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此颜色只存在于眼睛和大脑中。颜色是视觉系统对可见光的感知结果。 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同,因此不同组成成分的可见光就呈现出不同的颜色

4 视觉系统对颜色的感知 视觉系统对颜色和亮度的响应特性曲线 (各个波长的光的强度相等)

5 视觉系统对颜色的感知 上面的颜色响应曲线表明,人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。
亮度响应曲线表明人眼对波长为550nm左右的黄绿色最为敏感。

6 视觉系统对颜色的感知 许多具有不同光谱分布的光产生的视觉效果(颜色)是一样的。即光谱与颜色的对应是多对一的。
光谱分布不同而看上去相同的两种颜色称为条件等色(匹配等色)。 绝大部分可见光谱对眼睛的刺激效果都可以用红(700nm)、绿(546.1)、蓝(435.8nm)三色光按不同比例和强度的混合来等效表示。(三刺激理论)

7 视觉系统对颜色的感知 匹配任意可见光所需的三原色光比例曲线

8 视觉系统对颜色的感知 颜色匹配试验

9 视觉系统对颜色的感知

10 视觉系统对颜色的感知 从人的主观感觉角度,颜色包含三个要素:
1、色调(hue):色调反映颜色的类别,如红色、绿色、蓝色等。色调大致对应光谱分布中的主波长。

11 视觉系统对颜色的感知 2、饱和度(Saturation)
饱和度是指彩色光所呈现颜色的深浅或纯洁程度。对于同一色调的彩色光,其饱和度越高,颜色就越深,或越纯;而饱和度越小,颜色就越浅,或纯度越低。高饱和度的彩色光可因掺入白光而降低纯度或变浅,变成低饱和度的色光。100%饱和度的色光就代表完全没有混入白光的纯色光。

12 视觉系统对颜色的感知 3、明亮度(luminance)
明亮度是光作用于人眼时引起的明亮程度的感觉。一般来说,彩色光能量大则显得亮,反之则暗。 大量试验表明,人的眼睛能分辨128种不同的色调,10-30种不同的饱和度,而对亮度非常敏感。人眼大约可以分辨35万种颜色。

13 颜色模型 颜色模型(color model)是用来精确标定和生成各种颜色的一套规则和定义。某种颜色模型所标定的所有颜色就构成了一个颜色空间。
颜色空间通常用三维模型表示,空间中的颜色通常使用代表三个参数的三维坐标来指定 对于人来说,可以通过色调、饱和度和亮度来定义颜色(HSL颜色模型);对于显示设备来说,可以用红、绿、蓝磷光体的发光量来描述颜色(RGB颜色模型);对于打印设备来说,可以使用青色、品红、黄色和黑色颜料的用量来指定颜色(CMYK颜色模型)。

14 RGB颜色模型 理论上绝大部分可见光谱都可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。
颜色C=R(红色的百分比)+G(绿色的百分比)+ B(蓝色的百分比) RGB模型称为相加混色模型,用于光照、视频和显示器。例如,显示器通过红、绿和蓝荧光粉发射光线产生彩色。

15 CMYK颜色模型 在理论上,绝大多数颜色都可以用三种基本颜料(青色cyan、品红magenta、和黄色yellow)按一定比例混合得到。
理论上,青色、品红和黄色三种基本色素等量混合能得到黑色。但实际上,因为所有打印油墨都会包含一些杂质,这三种油墨混合实际上产生一种土灰色,必须与黑色 (K) 油墨混合才能产生真正的黑色,所以再加入黑色作为基本色形成CMYK颜色模型。 CMYK模型称为相减混色模型。

16 相加色与相减色的关系

17 RGB模型到CMYK模型的转换 分色算法(F代表白色)

18 颜色模型的空间表示 RGB彩色空间和CMY彩色空间的表示法

19 HSL颜色模型 在HSL模型中,H定义色调;S定义颜色的深浅程度或饱和度;L定义亮度。
RGB模型和CMYK模型主要是面向设备的,而HSL模型更容易被人理解和控制。的白光量

20 颜色的输入

21 图像的分类 矢量图与点位图 矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。 矢量图的优点是:(1)缩放、旋转、移动时图像不会失真。(2)存储和传输时数据量较小。 矢量图的缺点是:(1)图像显示时花费时间比较长。(2)真实世界的彩色图像难以转化为矢量图。

22 图像的分类 矢量图与点位图 点位图是将一副图像在空间上离散化,即将图像分成许许多多的像素,每个象素用若干个二进制位来指定该像素的颜色或灰度值。 点位图的优点是:(1)显示速度快。(2)真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。 点位图的缺点是: (1)存储和传输时数据量比较大。(2)缩放、旋转时算法复杂且容易失真。

23 图像的分类 矢量图 点位图

24 图像的分类 灰度图 标准单色图 标准灰度图

25 图像的分类 彩色图 256色标准图像 位标准图像

26 图像的基本属性 1、分辨率 显示分辨率:指显示屏上能够显示出的象素数目。同样大小显示屏能够显示的象素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。(640×480,1024 × 768) 图像分辨率:指组成一副图像的像素的密度,一般用单位长度上包含像素的个数来衡量。常用单位为DPI(dots per inch),即每英寸多少点。

27 图像的基本属性 2、像素深度 像素深度是指存储每个像素所用的位数。像素深度决定彩色图像每个像素可能有的颜色数,或者确定灰度图像每个像素可能有的灰度级数。 3、调色板 一个彩色图像假如只包含24位真彩色空间中的16个离散的点(16色图),则可以建立一个颜色查找表,表中的每一行记录一组RGB值,实际像素的值用来指定该点颜色在查找表中的索引值,这样就可以大大缩小存储量。这个颜色查找表就叫做调色板。

28 图像的基本属性 4、真彩色、伪彩色与直接色 真彩色:真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。 伪彩色:每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(调色板)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。 直接色:每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。

29 伽马()校正 一个图像系统中一般包含输入设备(扫描仪、摄像机、数码相机)、存储设备(胶片、磁盘)和输出设备三大模块。
各种涉及到光电转换的设备的输入输出特性曲线一般是非线性的,且表现为幂函数的形式: y=xn  输出=(输入)γ (按照惯例,“输入”和“输出”都缩放到0~1之间)。所以整个图像系统的传递函数是一个幂函数。= 1×2×…×n 一个图像系统追求的目标:真实的再现原始场景。

30 伽马()校正 为了真实地再现原始场景,如果图像再现环境为明亮环境则必须时整个图像系统的γ=1;如果为暗淡环境,则必须使整个系统的γ1.25;如果为黑暗环境,则必须使系统的γ1.5。 实际图像系统的值并非符合我们要求的值,且是不能随意改变的。所有要求我们加入一个中间环节来校正整个系统的值,即补偿系统的非特性曲线,使之接近于应用环境所要求的值。这个过程就叫做伽马()校正。

31 Photoshop 中提供的Gamma校正功能
伽马()校正 Photoshop 中提供的Gamma校正功能

32 BMP图像文件格式 位图文件头BITMAPFILEHEADER 位图信息头BITMAPINFOHEADER 调色板Palette
位图文件(Bitmap-File,BMP)格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式。BMP位图文件默认的文件扩展名是bmp或者dib。 BMP文件大体上分为四个部分: 位图文件头BITMAPFILEHEADER 位图信息头BITMAPINFOHEADER 调色板Palette 实际的位图数据ImageData

33 BMP图像文件格式 typedef struct tagBITMAPFILEHEADER {
WORD bfType; /* 说明文件的类型 */ DWORD bfSize; /* 说明文件的大小,用字节为单位 */ WORD bfReserved1; /* 保留,设置为0 */ WORD bfReserved2; /* 保留,设置为0 */ DWORD bfOffBits; /* 说明从BITMAPFILEHEADER结构 开始到实际的图像数据之间的字 节 偏移量 */ } BITMAPFILEHEADER;

34 BMP图像文件格式 typedef struct tagBITMAPINFOHEADER {
DWORD biSize; /* 说明结构体所需字节数 */ LONG biWidth; /* 以像素为单位说明图像的宽度 */ LONG biHeight; /* 以像素为单位说明图像的高速 */ WORD biPlanes; /* 说明位面数,必须为1 */ WORD biBitCount; /* 说明位数/像素,1、2、4、8、24 */ DWORD biCompression; /* 说明图像是否压缩及压缩类型 */ DWORD biSizeImage; /* 以字节为单位说明图像大小 */ LONG biXPelsPerMeter; /* 说明水平分辨率,像素/米 */ LONG biYPelsPerMeter; /* 说明垂直分辨率,像素/米 */ DWORD biClrUsed; /* 说明图像实际用到的颜色数,如果为0 则颜色数为2的biBitCount次方 */ DWORD biClrImportant; /*说明对图像显示有重要影响的颜色 索引的数目,如果是0,表示都重要。*/ } BITMAPINFOHEADER;

35 BMP图像文件格式 调色板实际上是一个数组,它所包含的元素与位图所具有的颜色数相同,决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。 typedef struct tagRGBQUAD { BYTE rgbBlue; /*指定蓝色分量*/ BYTE rgbGreen; /*指定绿色分量*/ BYTE rgbRed; /*指定红色分量*/ BYTE rgbReserved; /*保留,指定为0*/ } RGBQUAD;

36 BMP图像文件格式 紧跟在彩色表之后的是图像数据字节阵列。图像的每一扫描行由表示图像像素的连续的字节组成,每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。

37 GIF图像文件格式 GIF(Graphics Interchange Format)格式由CompuServe公司于87年开发,版本号GIF87a,89年扩充后版本号为GIF89a。 GIF图像文件以块(block)为单位存储信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成,称为GIF数据流(Data Stream)。数据流中的所有控制信息块和数据块都必须在文件头(Header)和文件结束块(Trailer)之间。

38 GIF图像文件格式 1 GIF文件头 2 逻辑屏幕描述块 3 全局颜色表 扩展模块(任选) 4 图像描述块 5 局部颜色表 可 6
Header GIF文件头 2 Logical Screen Descriptor 逻辑屏幕描述块 3 Gloabal Color Table 全局颜色表 。。。。。。 扩展模块(任选) 4 Image Descriptor 图像描述块 5 Local Color Table 局部颜色表 6 Table Based Image Data 表基压缩图像数据 7 Graphic Control Extension 图像控制扩展块 8 Plain Text Extension 无格式文本扩展块 n 9 Comment Extension 注释扩展块 10 Application Extension 应用程序扩展块 11 GIF Trailer GIF文件结束快

39 GIF图像文件格式 GIF文件格式的特点: GIF文件采用了LZW无损压缩算法来存储图像数据。 GIF文件允许设置背景的透明属性。

40 JPEG编码标准 算法概要 JPEG(Joint Photographic Experts Group) 是一个由 ISO和CCITT两个组织机构联合组成的一个图像专家小组,负责制定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为JPEG算法,并且成为国际上通用的标准。JPEG是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。JPEG不仅适于静止图像的压缩,电视图像的帧内图像的压缩编码,也常采用此算法。JPEG标准还可以大范围地调节图像压缩率及其保真度。 标准主要采用了两种基本的压缩算法,一种是采用以离散余弦变换(DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的DPCM无损压缩算法。

41 JPEG编码标准 JPEG规定了4种运行模式,以满足不同需要: 基于DPCM的无损编码模式:压缩比可以达到2:1。
基于DCT的有损顺序编码模式:压缩比可以达到10:1以上。 基于DCT的递增编码模式 基于DCT的分层编码模式

42 JPEG编码标准 JPEG有损顺序编码算法的主要计算步骤如下: 1. 将源图像分成几个颜色平面(分量图像)。
2. 分成8×8数据块进行正向离散余弦变换(FDCT)。 2. 量化(quantization)。 3. Z字形排列量化结果(zigzag scan)。 4. 使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码。 5. 使用行程长度编码(run-length encoding,RLE)对 交流系数(AC)进行编码。 6. 熵编码(entropy coding)。

43 JPEG编码标准

44 JPEG编码标准 译码或者叫做解压缩的过程与压缩编码过程正好相反。 IDCT

45 JPEG编码标准 正向离散余弦变换 对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,如图所示,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。 DCT变换使用下式计算 逆变换使用下式计算

46 JPEG编码标准 量化 对于有损压缩算法,JPEG算法使用如图所示的均匀量化器进行量化,量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。

47 JPEG编码标准 量化 因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。

48 JPEG编码标准 DC系数DPCM编码和AC系数Z形排列之后采用RLE编码

49 JPEG编码标准 熵编码 使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。 JPEG标准规定了两种熵编码算法:哈夫曼编码和自适应算术编码。哈夫曼编码采用的一般是固定的哈夫曼编码表,而不是临时统计出来的,并且对亮度分量和色度分量采用了不同的哈夫曼表。

50 JPEG编码标准 基于DPCM的无损编码模式:主要采用了三邻域二维预测编码和熵编码。 无失真编码器 预测器 熵编码器 压缩的图像数据
源图像数据 表说明 DPCM预测编码框图

51 JPEG编码标准 基于DCT的递增编码模式:
此模式与顺序模式编码步骤基本一致,不同之处在于递增模式每个图像分量的编码要经过多次扫描才完成。第一次扫描只进行一次粗糙的压缩,然后根据此数据先重建一幅质量低的图像,以后的扫描再作较细的扫描,使重建图像质量不断提高,直到满意为止。 递增模式分为两种: (1)按频段累进。 (2)按位累进。

52 JPEG编码标准 基于DCT的分层编码模式: (1)降低原始图像的空间分辨率。
(2)对已经降低分辨率的图像按照顺序编码模式进行压缩并存储或传输。 (3)对低分辨率图像进行解码,然后用插值法提高图像的分辨率。 (4)将分辨率已经升高的图像作为原图像的预测值,并把它与原图像的差值进行基于DCT的编码。 (5)重复步骤3、4直到图像达到完整的分辨率。

53 JPEG图像文件格式 JPEG标准委员会没有对JPEG文件格式作出明确的定义,现在被广泛采用的是1992年9月由C-Cube Microsystems公司提出的JPEG文件交换格式(JPEG File Interchange Format,JFIF),版本号为1.02。JFIF文件格式直接使用JPEG标准为应用程序定义的许多标记,因此JFIF格式成了事实上JPEG文件交换格式标准。 JEPG文件大体上可以分成两个部分:标记码(tag)和压缩数据。标记码部分给出了JPEG图像的所有信息,如图像的宽、高、Huffman表、量化表等等。

54 JPEG图像文件格式 JPEG文件使用的颜色空间是电视图像信号数字化标准ITU-RBT 601推荐标准规定的YCbCr彩色空间。从RGB转换成YCbCr的计算公式如下: Y = R G B Cb = R G + 0.5B + 128 Cr = 0.5 R G B + 128

55 MTI XIDIAN 结束


Download ppt "MTI 多媒体技术 第五讲 XIDIAN 彩色数字图像基础."

Similar presentations


Ads by Google