MTI 多媒体技术 第五讲 XIDIAN 彩色数字图像基础.

Slides:



Advertisements
Similar presentations
第三章 图像处理技术 第三章 多媒体图像处理技术.
Advertisements

第二章 数字图像媒体.
3.4 空间直线的方程.
第2章 图像处理.
第2章 数字图像表示 2.1 人眼成像过程 2.2 彩色视觉和颜色模型 2.3 图像采集装置 2.4 图像采样和量化 2.5 图像显示和打印
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
四川大学 计算机学院 陈 虎 彩色数字图像基础 四川大学 计算机学院 陈 虎
第1章 图像处理基础知识 1、图像类型 2、图像分辨率 3、图像格式 4、颜色模式.
第七章 多媒体技术 7.1 多媒体技术概述 7.2 多媒体计算机组成 7.3 数字图像基础 7.4 视频信息处理基础
第9章 平面图像处理基础 9.1 平面图像处理基本概念 9.2 Photoshop基础操作.
图形图像处理 潘荣江 山东大学计算机科学与技术学院
色彩基本認識 2010 年 9 月 Hsiu-fen Wang
探索三角形相似的条件(2).
C++中的声音处理 在传统Turbo C环境中,如果想用C语言控制电脑发声,可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为: Beep(频率,持续时间) , 单位毫秒 暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒 引用这两个函数时,必须包含头文件
Chapter 2: Digital Image Fundamentals
第九章 影像壓縮.
任延珍 武汉大学计算机学院 空天信息安全与可信计算教育部重点实验室
Hadoop I/O By ShiChaojie.
數位典藏之數位影像處理技術探討 雲端上的寶藏~ 國立新港藝術高中 蘇淵源.
存储系统.
数字图像处理(2) 图像文件格式 东北林业大学信息学院 任洪娥
走进编程 程序的顺序结构(二).
數位影像壓縮 技術簡介 第四組 陳孝賢.
P hoto s hop 第一临床学院 08级临床八年 昌金星.
2 数字图像基础 赵国庆 博士 北京师范大学教育技术学院
第一单元 初识C程序与C程序开发平台搭建 ---观其大略
影像處理軟身操 數位影像的基本觀念與實作 劉明玲主講.
数学基础及图像的基本概念 (研究生) 巫义锐 河海大学计算机与信息学院 个人网址:wuyirui.github.io
数字图像处理(一).
DM8148与DM8127 ISS框架讲解 广州创龙电子科技有限公司
彩色数字电视系统的颜色空间.
第二章 图像和视觉基础 图象处理的研究需要了解人类视觉机理: 人们能够区分的光强度差别有多大?
对本书、视频等任何MATLAB问题,作者做到有问必答!
第8章 DCT与JPEG编码 JPEG(Joint Photographic Experts Group联合图象专家组)是(ITU的前身)国际电话与电报咨询委员会CCITT与ISO于1986年联合成立的一个小组,负责制定静态图像的编码标准 1992年9月JPEG推出了ISO/IEC 10918标准(CCITT.
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
多媒体技术 中南大学信息科学与工程学院 黄东军.
2.1.2 空间中直线与直线 之间的位置关系.
多媒体技术基础(第3版) 第4章 彩色数字图像基础
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
色彩基本認識 2006 年 10 月 Hsiu-fen Wang.
C语言程序设计 主讲教师:陆幼利.
影像處理.
图像压缩标准JPEG.
直接扫描保存成TIF格式, 其他图片格式用Windows XP自带的 Windows图片与传真查看器打开
晶体管及其小信号放大 -单管共射电路的频率特性.
晶体管及其小信号放大 -单管共射电路的频率特性.
电子商务网站开发 第八讲:图像的概念与制作 上海财经大学信息管理与工程学院.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
电影海报设计 ——巧用“分层云彩”滤镜.
林福宗 清华大学 计算机科学与技术系 2008年9月 2019年5月5日 多媒体技术教程 第4章 彩色数字图像基础 林福宗 清华大学 计算机科学与技术系 2008年9月.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
多媒体技术基础 数字图像 Digital Image.
_13简单的GDI绘图操作 本节课讲师——void* 视频提供:昆山爱达人信息技术有限公司 官网地址:
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
《手把手教你学STM32》 主讲人 :正点原子团队 硬件平台:正点原子STM32开发板 版权所有:广州市星翼电子科技有限公司 淘宝店铺:
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
Photoshop处理数码照片的基本方法
多媒體網頁 授課教師:葉生正教授.
课堂学习目标 了解位图、矢量图和分辨率 熟悉图像的不同色彩模式 熟悉软件常用的文件格式. 课堂学习目标 了解位图、矢量图和分辨率 熟悉图像的不同色彩模式 熟悉软件常用的文件格式.
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
基于列存储的RDF数据管理 朱敏
第8章 创建与使用图块 将一个或多个单一的实体对象整合为一个对象,这个对象就是图块。图块中的各实体可以具有各自的图层、线性、颜色等特征。在应用时,图块作为一个独立的、完整的对象进行操作,可以根据需要按一定比例和角度将图块插入到需要的位置。 2019/6/30.
第二章 数字图像处理基础 2.1 图像数字化技术 2.2 数字图像类型 2.3 图像文件格式 2.4 色度学基础与颜色模型.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
香港城市大学 导师: 布礼文教授( Dr. L M Po ) 学生: 徐叙远 ( Xu Xuyuan )
§4.5 最大公因式的矩阵求法( Ⅱ ).
颜色模型 计算机科学与技术系.
第一章 JPEG介紹.
《手把手教你学STM32-STemWin》 主讲人 :正点原子团队 硬件平台:正点原子STM32开发板 版权所有:广州市星翼电子科技有限公司
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

MTI 多媒体技术 第五讲 XIDIAN 彩色数字图像基础

主要内容 视觉系统对颜色的感知 图像的颜色模型 图像的基本属性 图像的分类 伽马()校正 常用图像文件格式

视觉系统对颜色的感知 可见光的波长范围为380nm~780nm,大多数自然光都是由不同波长的光组合而成。 人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此颜色只存在于眼睛和大脑中。颜色是视觉系统对可见光的感知结果。 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同,因此不同组成成分的可见光就呈现出不同的颜色

视觉系统对颜色的感知 视觉系统对颜色和亮度的响应特性曲线 (各个波长的光的强度相等)

视觉系统对颜色的感知 上面的颜色响应曲线表明,人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。 亮度响应曲线表明人眼对波长为550nm左右的黄绿色最为敏感。

视觉系统对颜色的感知 许多具有不同光谱分布的光产生的视觉效果(颜色)是一样的。即光谱与颜色的对应是多对一的。 光谱分布不同而看上去相同的两种颜色称为条件等色(匹配等色)。 绝大部分可见光谱对眼睛的刺激效果都可以用红(700nm)、绿(546.1)、蓝(435.8nm)三色光按不同比例和强度的混合来等效表示。(三刺激理论)

视觉系统对颜色的感知 匹配任意可见光所需的三原色光比例曲线

视觉系统对颜色的感知 颜色匹配试验

视觉系统对颜色的感知

视觉系统对颜色的感知 从人的主观感觉角度,颜色包含三个要素: 1、色调(hue):色调反映颜色的类别,如红色、绿色、蓝色等。色调大致对应光谱分布中的主波长。

视觉系统对颜色的感知 2、饱和度(Saturation) 饱和度是指彩色光所呈现颜色的深浅或纯洁程度。对于同一色调的彩色光,其饱和度越高,颜色就越深,或越纯;而饱和度越小,颜色就越浅,或纯度越低。高饱和度的彩色光可因掺入白光而降低纯度或变浅,变成低饱和度的色光。100%饱和度的色光就代表完全没有混入白光的纯色光。

视觉系统对颜色的感知 3、明亮度(luminance) 明亮度是光作用于人眼时引起的明亮程度的感觉。一般来说,彩色光能量大则显得亮,反之则暗。 大量试验表明,人的眼睛能分辨128种不同的色调,10-30种不同的饱和度,而对亮度非常敏感。人眼大约可以分辨35万种颜色。

颜色模型 颜色模型(color model)是用来精确标定和生成各种颜色的一套规则和定义。某种颜色模型所标定的所有颜色就构成了一个颜色空间。 颜色空间通常用三维模型表示,空间中的颜色通常使用代表三个参数的三维坐标来指定 对于人来说,可以通过色调、饱和度和亮度来定义颜色(HSL颜色模型);对于显示设备来说,可以用红、绿、蓝磷光体的发光量来描述颜色(RGB颜色模型);对于打印设备来说,可以使用青色、品红、黄色和黑色颜料的用量来指定颜色(CMYK颜色模型)。

RGB颜色模型 理论上绝大部分可见光谱都可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。 颜色C=R(红色的百分比)+G(绿色的百分比)+ B(蓝色的百分比) RGB模型称为相加混色模型,用于光照、视频和显示器。例如,显示器通过红、绿和蓝荧光粉发射光线产生彩色。

CMYK颜色模型 在理论上,绝大多数颜色都可以用三种基本颜料(青色cyan、品红magenta、和黄色yellow)按一定比例混合得到。 理论上,青色、品红和黄色三种基本色素等量混合能得到黑色。但实际上,因为所有打印油墨都会包含一些杂质,这三种油墨混合实际上产生一种土灰色,必须与黑色 (K) 油墨混合才能产生真正的黑色,所以再加入黑色作为基本色形成CMYK颜色模型。 CMYK模型称为相减混色模型。

相加色与相减色的关系

RGB模型到CMYK模型的转换 分色算法(F代表白色)

颜色模型的空间表示 RGB彩色空间和CMY彩色空间的表示法

HSL颜色模型 在HSL模型中,H定义色调;S定义颜色的深浅程度或饱和度;L定义亮度。 RGB模型和CMYK模型主要是面向设备的,而HSL模型更容易被人理解和控制。的白光量

颜色的输入

图像的分类 矢量图与点位图 矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。 矢量图的优点是:(1)缩放、旋转、移动时图像不会失真。(2)存储和传输时数据量较小。 矢量图的缺点是:(1)图像显示时花费时间比较长。(2)真实世界的彩色图像难以转化为矢量图。

图像的分类 矢量图与点位图 点位图是将一副图像在空间上离散化,即将图像分成许许多多的像素,每个象素用若干个二进制位来指定该像素的颜色或灰度值。 点位图的优点是:(1)显示速度快。(2)真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。 点位图的缺点是: (1)存储和传输时数据量比较大。(2)缩放、旋转时算法复杂且容易失真。

图像的分类 矢量图 点位图

图像的分类 灰度图 标准单色图 标准灰度图

图像的分类 彩色图 256色标准图像 24位标准图像

图像的基本属性 1、分辨率 显示分辨率:指显示屏上能够显示出的象素数目。同样大小显示屏能够显示的象素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。(640×480,1024 × 768) 图像分辨率:指组成一副图像的像素的密度,一般用单位长度上包含像素的个数来衡量。常用单位为DPI(dots per inch),即每英寸多少点。

图像的基本属性 2、像素深度 像素深度是指存储每个像素所用的位数。像素深度决定彩色图像每个像素可能有的颜色数,或者确定灰度图像每个像素可能有的灰度级数。 3、调色板 一个彩色图像假如只包含24位真彩色空间中的16个离散的点(16色图),则可以建立一个颜色查找表,表中的每一行记录一组RGB值,实际像素的值用来指定该点颜色在查找表中的索引值,这样就可以大大缩小存储量。这个颜色查找表就叫做调色板。

图像的基本属性 4、真彩色、伪彩色与直接色 真彩色:真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。 伪彩色:每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(调色板)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。 直接色:每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。

伽马()校正 一个图像系统中一般包含输入设备(扫描仪、摄像机、数码相机)、存储设备(胶片、磁盘)和输出设备三大模块。 各种涉及到光电转换的设备的输入输出特性曲线一般是非线性的,且表现为幂函数的形式: y=xn  输出=(输入)γ (按照惯例,“输入”和“输出”都缩放到0~1之间)。所以整个图像系统的传递函数是一个幂函数。= 1×2×…×n 一个图像系统追求的目标:真实的再现原始场景。

伽马()校正 为了真实地再现原始场景,如果图像再现环境为明亮环境则必须时整个图像系统的γ=1;如果为暗淡环境,则必须使整个系统的γ1.25;如果为黑暗环境,则必须使系统的γ1.5。 实际图像系统的值并非符合我们要求的值,且是不能随意改变的。所有要求我们加入一个中间环节来校正整个系统的值,即补偿系统的非特性曲线,使之接近于应用环境所要求的值。这个过程就叫做伽马()校正。

Photoshop 中提供的Gamma校正功能 伽马()校正 Photoshop 中提供的Gamma校正功能

BMP图像文件格式 位图文件头BITMAPFILEHEADER 位图信息头BITMAPINFOHEADER 调色板Palette 位图文件(Bitmap-File,BMP)格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式。BMP位图文件默认的文件扩展名是bmp或者dib。 BMP文件大体上分为四个部分: 位图文件头BITMAPFILEHEADER 位图信息头BITMAPINFOHEADER 调色板Palette 实际的位图数据ImageData

BMP图像文件格式 typedef struct tagBITMAPFILEHEADER { WORD bfType; /* 说明文件的类型 */ DWORD bfSize; /* 说明文件的大小,用字节为单位 */ WORD bfReserved1; /* 保留,设置为0 */ WORD bfReserved2; /* 保留,设置为0 */ DWORD bfOffBits; /* 说明从BITMAPFILEHEADER结构 开始到实际的图像数据之间的字 节 偏移量 */ } BITMAPFILEHEADER;

BMP图像文件格式 typedef struct tagBITMAPINFOHEADER { DWORD biSize; /* 说明结构体所需字节数 */ LONG biWidth; /* 以像素为单位说明图像的宽度 */ LONG biHeight; /* 以像素为单位说明图像的高速 */ WORD biPlanes; /* 说明位面数,必须为1 */ WORD biBitCount; /* 说明位数/像素,1、2、4、8、24 */ DWORD biCompression; /* 说明图像是否压缩及压缩类型 */ DWORD biSizeImage; /* 以字节为单位说明图像大小 */ LONG biXPelsPerMeter; /* 说明水平分辨率,像素/米 */ LONG biYPelsPerMeter; /* 说明垂直分辨率,像素/米 */ DWORD biClrUsed; /* 说明图像实际用到的颜色数,如果为0 则颜色数为2的biBitCount次方 */ DWORD biClrImportant; /*说明对图像显示有重要影响的颜色 索引的数目,如果是0,表示都重要。*/ } BITMAPINFOHEADER;

BMP图像文件格式 调色板实际上是一个数组,它所包含的元素与位图所具有的颜色数相同,决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。 typedef struct tagRGBQUAD { BYTE rgbBlue; /*指定蓝色分量*/ BYTE rgbGreen; /*指定绿色分量*/ BYTE rgbRed; /*指定红色分量*/ BYTE rgbReserved; /*保留,指定为0*/ } RGBQUAD;

BMP图像文件格式 紧跟在彩色表之后的是图像数据字节阵列。图像的每一扫描行由表示图像像素的连续的字节组成,每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。

GIF图像文件格式 GIF(Graphics Interchange Format)格式由CompuServe公司于87年开发,版本号GIF87a,89年扩充后版本号为GIF89a。 GIF图像文件以块(block)为单位存储信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成,称为GIF数据流(Data Stream)。数据流中的所有控制信息块和数据块都必须在文件头(Header)和文件结束块(Trailer)之间。

GIF图像文件格式 1 GIF文件头 2 逻辑屏幕描述块 3 全局颜色表 扩展模块(任选) 4 图像描述块 5 局部颜色表 可 6 Header GIF文件头 2 Logical Screen Descriptor 逻辑屏幕描述块 3 Gloabal Color Table 全局颜色表 。。。。。。 扩展模块(任选) 4 Image Descriptor 图像描述块 5 Local Color Table 局部颜色表 可 6 Table Based Image Data 表基压缩图像数据 重 7 Graphic Control Extension 图像控制扩展块 复 8 Plain Text Extension 无格式文本扩展块 n 9 Comment Extension 注释扩展块 次 10 Application Extension 应用程序扩展块 11 GIF Trailer GIF文件结束快

GIF图像文件格式 GIF文件格式的特点: GIF文件采用了LZW无损压缩算法来存储图像数据。 GIF文件允许设置背景的透明属性。

JPEG编码标准 算法概要 JPEG(Joint Photographic Experts Group) 是一个由 ISO和CCITT两个组织机构联合组成的一个图像专家小组,负责制定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为JPEG算法,并且成为国际上通用的标准。JPEG是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。JPEG不仅适于静止图像的压缩,电视图像的帧内图像的压缩编码,也常采用此算法。JPEG标准还可以大范围地调节图像压缩率及其保真度。 标准主要采用了两种基本的压缩算法,一种是采用以离散余弦变换(DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的DPCM无损压缩算法。

JPEG编码标准 JPEG规定了4种运行模式,以满足不同需要: 基于DPCM的无损编码模式:压缩比可以达到2:1。 基于DCT的有损顺序编码模式:压缩比可以达到10:1以上。 基于DCT的递增编码模式 基于DCT的分层编码模式

JPEG编码标准 JPEG有损顺序编码算法的主要计算步骤如下: 1. 将源图像分成几个颜色平面(分量图像)。 2. 分成8×8数据块进行正向离散余弦变换(FDCT)。 2. 量化(quantization)。 3. Z字形排列量化结果(zigzag scan)。 4. 使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码。 5. 使用行程长度编码(run-length encoding,RLE)对 交流系数(AC)进行编码。 6. 熵编码(entropy coding)。

JPEG编码标准

JPEG编码标准 译码或者叫做解压缩的过程与压缩编码过程正好相反。 IDCT

JPEG编码标准 正向离散余弦变换 对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,如图所示,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。 DCT变换使用下式计算 逆变换使用下式计算

JPEG编码标准 量化 对于有损压缩算法,JPEG算法使用如图所示的均匀量化器进行量化,量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。

JPEG编码标准 量化 因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。

JPEG编码标准 DC系数DPCM编码和AC系数Z形排列之后采用RLE编码

JPEG编码标准 熵编码 使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。 JPEG标准规定了两种熵编码算法:哈夫曼编码和自适应算术编码。哈夫曼编码采用的一般是固定的哈夫曼编码表,而不是临时统计出来的,并且对亮度分量和色度分量采用了不同的哈夫曼表。

JPEG编码标准 基于DPCM的无损编码模式:主要采用了三邻域二维预测编码和熵编码。 无失真编码器 预测器 熵编码器 压缩的图像数据 源图像数据 表说明 DPCM预测编码框图

JPEG编码标准 基于DCT的递增编码模式: 此模式与顺序模式编码步骤基本一致,不同之处在于递增模式每个图像分量的编码要经过多次扫描才完成。第一次扫描只进行一次粗糙的压缩,然后根据此数据先重建一幅质量低的图像,以后的扫描再作较细的扫描,使重建图像质量不断提高,直到满意为止。 递增模式分为两种: (1)按频段累进。 (2)按位累进。

JPEG编码标准 基于DCT的分层编码模式: (1)降低原始图像的空间分辨率。 (2)对已经降低分辨率的图像按照顺序编码模式进行压缩并存储或传输。 (3)对低分辨率图像进行解码,然后用插值法提高图像的分辨率。 (4)将分辨率已经升高的图像作为原图像的预测值,并把它与原图像的差值进行基于DCT的编码。 (5)重复步骤3、4直到图像达到完整的分辨率。

JPEG图像文件格式 JPEG标准委员会没有对JPEG文件格式作出明确的定义,现在被广泛采用的是1992年9月由C-Cube Microsystems公司提出的JPEG文件交换格式(JPEG File Interchange Format,JFIF),版本号为1.02。JFIF文件格式直接使用JPEG标准为应用程序定义的许多标记,因此JFIF格式成了事实上JPEG文件交换格式标准。 JEPG文件大体上可以分成两个部分:标记码(tag)和压缩数据。标记码部分给出了JPEG图像的所有信息,如图像的宽、高、Huffman表、量化表等等。

JPEG图像文件格式 JPEG文件使用的颜色空间是电视图像信号数字化标准ITU-RBT 601推荐标准规定的YCbCr彩色空间。从RGB转换成YCbCr的计算公式如下: Y = 0.299 R + 0.587G + 0.114 B Cb = - 0.1687R - 0.3313G + 0.5B + 128 Cr = 0.5 R - 0.4187G - 0.0813 B + 128

MTI XIDIAN 结束