JPEG图像编码标准 §3.4 内容提要 本节主要介绍JPEG图像压缩编码算法(DCT变换算法)、图像数据文件格式 (JFIF,JPEG File Interchange Format)。 最后,对JPEG 2000进行一个简单的介绍。 JPEG
内容提纲 JPEG 3.4.1 JPEG标准与JPEG图像 3.4.2 JPEG图像格式 3.4.3 JPEG图像压缩编码算法 参 考 文 献 JPEG
JPEG与JPEG图像 A、参 考 文 献 About JPEG §3.4.1 一、ISO/IEC JPEG (Joint Photographic Experts Group)简介 二、关于JPEG图像 A、参 考 文 献 About JPEG
“Digital compression and coding of continuous-tone still images” 一. 关于JPEG JPEG : Joint Photographic Experts Group 由ISO与IEC于1986年联合成立的一个专家委员会(WG1),其宪章(charter)是: 其中的“Joint”还有与ITU联合的意思 在过去的十几年中,该委员会制定了一系列的静态连续色调图像压缩编码标准(如:有损、无损及接近无损等编码标准),并于1996年开始制定JPEG 2000标准。 “Digital compression and coding of continuous-tone still images” 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
关于JPEG (cont.) 已经发布的标准有: JPEG2000标准(草案) ISO/IEC 10918-1 | ITU-T Rec. T.81 : Requirements and guidelines ISO/IEC 10918-2 | ITU-T Rec. T.83 : Compliance testing ISO/IEC 10918-3 | ITU-T Rec. T.84: Extensions ISO/IEC 10918-4 | ITU-T Rec. T.86: Registration of JPEG Parameters, Profiles, Tags, Color Spaces, APPn Markers, Compression Types, and Registration Authorities (REGAUT) DIS 14495-1 | ITU-T Draft Rec. T.87 : Lossless and Near-Lossless Compression of Continuous-Tone Still Images – Baseline JPEG2000标准(草案) ISO/IEC FCD15444-1: 2000 | ITU-T Rec. T.800 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
二. 关于JPEG图像 压缩编码算法主要有: 基于离散余弦变换(Discrete Cosine Transform, DCT)的有损压缩(lossy compression)算法。该算法还包括熵编码(Entropy Coding),霍夫曼编码(Huffman coding)等算法。 基于预测的无损数据压缩算法。 算法所处理的图像为静态连续色调(still continuous-tone)的彩色或灰度(grayscale)图像。 压缩算法与彩色空间无关,颜色变换不包括在算法中。 编码模型有:顺序(Sequential encoding)、累进(Progressive encoding)、无损(Lossless encoding)、层次(Hierarchical encoding)编码模型。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式 JPEG (一) JPEG图像格式简介 (二) JFIF (JPEG File Interchange Format,即 §3.4.2 (一) JPEG图像格式简介 (二) JFIF (JPEG File Interchange Format,即 JPEG图像文件交换格式) (三) JFIF格式图像数据分析 100101 JPEG
(一)JPEG图像格式简介 JPEG图像为静止连续色调(still continuous-tone)图像,有广泛的用途。 如:数码相机、Web page images、MPEG的帧内图像(I图像)、… JPEG委员会在制定JPEG标准时,定义了许多标记(marker)来区分和识别图像数据及其相关的信息。但是,到目前为止,关于JPEG文件交换格式明确定义的详细说明,在相关的“规范”或“建议”(如ITU T.81)中没有见到。 目前使用的格式为JFIF v1.02和TIFF JPEG等,其中前者的使用比较广泛,大多数应用程序均加以支持,其他格式比较复杂。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式简介 (cont.) JPEG文件使用的颜色空间为1982年推荐的电视图像数字化标准CCIR 601 (现为ITU-RB T.601)。在这个色彩空间中,每个分量、每个像素的电平规定为255级,用8位代码表示。 颜色转换 从RGB转换成YCbCr空间时,使用下面的精确的转换关系: Y = 256 × E'y Cb = 256 × [E'Cb] + 128 Cr = 256 × [E'Cr] + 128 其中亮度电平E'y和色差电平E'Cb和E'Cb分别是CCIR 601定义的参数。由于E'y的范围是0~1,E'Cb和E'Cb的范围是-0.5~+0.5,因此Y, Cb和Cr的最大值必须要到255。于是RGB和YCbCr之间的转换关系需要按照下面的方法计算。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式简介 (cont.) 颜色转换 从RGB转换成YCbCr YCbCr(256级)分量可直接从用8位表示的RGB分量计算得到: Y = 0.299 R + 0.587 G + 0.114 B Cb = - 0.1687R - 0.3313G + 0.5 B + 128 Cr = 0.5 R - 0.4187G - 0.0813 B + 128 需要注意的是: 不是所有图像文件格式都按照R0,G0,B0,…,Rn,Gn,Bn的次序存储样本数据,因此在RGB文件转换成JFIF文件时需要首先验证RGB的次序。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式简介 (cont.) 颜色转换 从YCbCr 转换成RGB RGB分量可直接从YCbCr (256级)分量计算得到: R = Y + 1.402 (Cr - 128) G = Y - 0.34414 (Cb - 128) - 0.71414 (Cr - 128) B = Y + 1.772 (Cb - 128) 在JFIF文件格式中,图像样本的存放顺序是从左到右和从上到下。这就是说JFIF文件中的第一个图像样本是图像左上角的样本。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
RGB YCbCr YCbCr RGB 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式简介 (cont.) JPEG的主要标记(marker) 下面为其中的8个主要标记 标记名 标记值 含义 SOI 0xD8 图像开始 APP0 0xE0 JFIF应用数据块 APPn 0xE1 - 0xEF 其他的应用数据块(n, 1~15) DQT 0xDB 量化表 SOF0 0xC0 帧开始 DHT 0xC4 霍夫曼(Huffman)表 SOS 0xDA 扫描线开始 EOI 0xD9 图像结束 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式简介 (cont.) 附表:JPEG定义的标记列表 Symbol (符号) Code Assignment (标记代码) Description (说明) Start Of Frame markers, non-hierarchical Huffman coding SOF0 0xFFC0 Baseline DCT SOF1 0xFFC1 Extended sequential DCT SOF2 0xFFC2 Progressive DCT SOF3 0xFFC3 Spatial (sequential) lossless Start Of Frame markers, hierarchical Huffman coding SOF5 0xFFC5 Differential sequential DCT SOF6 0xFFC6 Differential progressive DCT SOF7 0xFFC7 Differential spatial lossless 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式简介 (cont.) 附表:JPEG定义的标记列表(续) Start Of Frame markers, hierarchical arithmetic coding SOF13 0xFFCD Differential sequential DCT SOF14 0xFFCE Differential progressive DCT SOF15 0xFFCF Differential spatial Lossless Huffman table specification DHT 0xFFC4 Define Huffman table(s) arithmetic coding conditioning specification DAC 0xFFCC Define arithmetic conditioning table Restart interval termination RSTm 0xFFD0~0xFFD7 Restart with modulo 8 counter m 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式简介 (cont.) 附表:JPEG定义的标记列表(续) 2018年9月21日2018年9月21日 Other marker SOI 0xFFD8 Start of image EOI 0xFFD9 End of image SOS 0xFFDA Start of scan DQT 0xFFDB Define quantization table(s) DNL 0xFFDC Define number of lines DRI 0xFFDD Define restart interval DHP 0xFFDE Define hierarchical progression EXP 0xFFDF Expand reference image(s) APPn 0xFFE0~0xFFEF Reserved for application use JPGn 0xFFF0~0xFFFD Reserved for JPEG extension COM 0xFFFE Comment Reserved markers TEM 0xFF01 For temporary use in arithmetic coding RES 0xFF02~0xFFBF Reserved 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像格式简介 (cont.) 附表:APP0域的详细结构 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术 偏移 长度 内容 块的名称 说明 2 byte 0xFFD8 (Start of Image, SOI) 图像开始 2 0xFFE0 APP0(JFIF application segment) JFIF应用数据块 4 2 bytes length of APP0 block APP0块的长度 6 5 bytes "JFIF"+"0" 识别APP0标记 11 1 byte <Major version> 主要版本号(如版本1.02中的1) 12 <Minor version> 次要版本号(如版本1.02中的02) 13 <Units for the X and Y densities> X和Y的密度单位 units=0:无单位 units=1:点数/英寸 units=2:点数/厘米 14 <X density> 水平方向像素密度 16 <Y density> 垂直方向像素密度 18 <X thumbnail> 缩略图水平像素数目 19 <Y thumbnail> 缩略图垂直像素数目 3n < Thumbnail RGB bitmap> 缩略RGB位图(n为缩略图的像素数) Optional JFIF extension APP0 marker segment (s) 任选的JFIF扩展APP0标记段 …… 0xFFD9 (EOI) end-of-file 图像文件结束标记 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
(二)JFIF文件格式 JFIF : JPEG File Interchange Format ( JPEG文件交换格式 ) 该格式由Eric Hamilton于1992年提出,已经成为事实上( de facto )的JPEG图像文件交换格式标准。 该格式直接使用JPEG专家组为JPEG图像定义的诸多标记( marker )。JPEG的每个标记都由两个字节组成,前一个字节的值固定为0xFF (JPEG文件的字节是按正序( big endian )排列的)。每个标记之前还可以添加数目不限的0xFF填充字节 ( fill byte)。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JFIF文件结构 (cont.) JFIF特性: 使用JPEG压缩算法 使用JPEG交换格式的图像数据压缩表示法 PC 或 Mac 或 Unix 工作站均兼容 标准的颜色空间: 一个或三个颜色分量。(对于三个颜色分量,采用 Y Cb Cr (CCIR 601-256级)规范) APP0 标记 用于指定 计量单位制、 X, Y像素的密度以及缩略图的细节 APP0 标记同样用于指定JFIF的扩展方法 APP0 标记还用于指定其他与应用相关的信息 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JFIF文件结构 (cont.) JPEG文件由下面的8个部分组成 (1) 图像开始SOI (Start of Image)标记 (2) APP0标记(Marker) ① APP0长度(length) ② 标识符(identifier) ③ 版本号(version) ④ X和Y的密度单位 (units=0:无单位;units=1:点数/英寸;units=2:点数/厘米) ⑤ X方向像素密度(X density) ⑥ Y方向像素密度(Y density) ⑦ 缩略图水平像素数目(thumbnail horizontal pixels) ⑧ 缩略图垂直像素数目(thumbnail vertical pixels) ⑨ 缩略图RGB位图(thumbnail RGB bitmap) (3) APPn标记(Markers),其中n=1~15(任选) ① APPn长度(length) ② 由于详细信息(application specific information) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JFIF文件结构 (cont.) JPEG文件由下面的8个部分组成(续) (4) 一个或者多个量化表DQT (define quantization table) ① 量化表长度(quantization table length) ② 量化表数目(quantization table number) ③ 量化表(quantization table) (5) 帧图像开始SOF0(Start of Frame) ① 帧开始长度(start of frame length) ② 精度(precision),每个颜色分量每个像素的位数 (bits per pixel per color component) ③ 图像高度(image height) ④ 图像宽度(image width) ⑤ 颜色分量数(number of color components) ⑥ 对每个颜色分量(for each component) ID 垂直方向的样本因子(vertical sample factor) 水平方向的样本因子(horizontal sample factor) 量化表号(quantization table#) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JFIF文件结构 (cont.) JPEG文件由下面的8个部分组成(续) (6) 一个或者多个霍夫曼表DHT (Define Huffman Table) ① 霍夫曼表的长度(Huffman table length) ② 类型、AC或者DC (Type, AC or DC) ③ 索引(Index) ④ 位表(bits table) ⑤ 值表(value table) (7) 扫描开始SOS (Start of Scan) ① 扫描开始长度(start of scan length) ② 颜色分量数(number of color components) ③ 每个颜色分量 ID 交流系数表号(AC table #) 直流系数表号(DC table #) ④ 压缩图像数据(compressed image data) (8) 图像结束EOI (End of Image) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
sample image (16×16 Pixels) (三)JFIF格式图像数据分析 文件类型 标识 一个 16×16像素图像(JFIF格式)数据 sample image (16×16 Pixels) marker blocks : 000000 ~ 0001e0 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
sample image (16×16 Pixels) JFIF格式图像数据分析 (cont.) 一个 16×16像素图像(JFIF格式)数据 sample image (16×16 Pixels) original Bitmap image blocks : 0001f0 ~ 000350 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
参考文献 Gregory K. Wallace. The JPEG Still Picture Compression Standard. Communications of the ACM. 1991, 34(4): 30 ~ 44. Still Picture Interchange File Format (SPIFF) Eric Hamilton. JPEG File Interchange Format, Version 1.02. 1992. ITU Recommendation T.81 : INFORMATION TECHNOLOGY – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES. JPEG image compression FAQ, part 1 & 2. http://www.faqs.org/faqs/jpeg-faq/ A. Skodras, C. Christopoulos, and T. Ebrahimi. JEPG2000 Still Image Compression Standard. IEEE Signal Processing Magazine, 2001. 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG图像压缩编码算法概要 JPEG图像压缩编码算法的主要步骤 基于DCT的算法举例 基于DCT的扩展编码(累进、分层编码) §3.4.3 JPEG图像压缩编码算法概要 JPEG图像压缩编码算法的主要步骤 基于DCT的算法举例 基于DCT的扩展编码(累进、分层编码) JPEG
算法概要 1. JPEG专家组开发了两种基本的压缩算法: 算法的特点 以离散余弦变换(Discrete Cosine Transform,DCT)为基础的有损压缩算法 以预测技术为基础的无损压缩算法 算法的特点 JPEG有损压缩算法利用了人的视角系统的特性,使用量化和无损压缩编码相结合来去掉视角的冗余信息和数据本身的冗余信息。在压缩比为25:1的情况下,压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。 JPEG算法与彩色空间无关,因此“RGB到YUV变换”和“YUV到RGB变换”不包含在JPEG算法中。JPEG算法处理的彩色图像是单独的彩色分量图像,因此它可以压缩来自不同彩色空间的数据,如RGB, YCbCr和CMYK。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
算法概要 (cont.) 压缩编码大致分成三个步骤: 译码或者叫做解压缩的过程与压缩编码过程正好相反。 使用正向离散余弦变换(forward discrete cosine transform,FDCT)把空间域表示的图变换成频率域表示的图。 使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统是最佳的。 使用霍夫曼可变字长编码器对量化系数进行编码。 译码或者叫做解压缩的过程与压缩编码过程正好相反。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
算法概要 (cont.) JPEG压缩编码-解压缩算法框图 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
主要计算步骤 2. JPEG压缩编码算法的主要计算步骤如下: 正向离散余弦变换(FDCT) 量化(quantization) Z字形编码(zigzag scan) 使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码 使用行程长度编码(run-length encoding,RLE)对交流系数(AC)进行编码 熵编码(entropy coding) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
主要计算步骤:① 正向离散余弦变换(FDCT) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
主要计算步骤:① (cont.) 正向离散余弦变换(FDCT) f ( i, j ) 经变换之后,F( 0, 0 )是直流系数(DC,即64个空域图像采样值的平均值),其他为交流系数(AC)。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
计算步骤:① (cont.) 正向离散余弦变换(FDCT) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
计算步骤:② 量化(Quantization) 量化是对经过FDCT变换后的频率系数进行量化,其目的是减小非“0”系数的幅度以及增加“0”值系数的数目。 对于有损压缩算法,使用均匀量化器进行量化。量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
计算步骤:② (cont.) 量化(Quantization) 因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。 由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。 (亮度量化值表) (色度量化值) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
计算步骤:③ Z字形编排(Zigzag Scan) 1 5 6 14 15 27 28 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 10 19 23 32 39 45 52 54 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 63 量化DCT系数的序号 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
计算步骤:④ 直流系数(DC)的编码 DC系数的特点:8 × 8图像块经过DCT变换之后得到的DC直流系数有两个特点,一是系数的数值比较大,二是相邻8 × 8图像块的DC系数值变化不大。 JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值(Delta)进行编码。 DCi-1 DCi … blocki-1 blocki … 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
计算步骤:⑤ 交流系数(AC)的编码 AC系数的特点:1 × 64矢量中包含有许多“0”系数,并且许多“0”是连续的。 JPEG使用非常简单和直观的游程长度编码(RLE)对它们进行编码。 JPEG使用了1个字节的高4位来表示连续“0”的个数,而使用它的低4位来表示编码下一个非“0”系数所需要的位数,跟在它后面的是量化AC系数的数值。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
计算步骤:⑥ 熵(Entropy)编码 使用熵编码的原因:对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。 在JPEG有损压缩算法中,使用霍夫曼编码器来减少熵,霍夫曼编码器使用很简单的查表(lookup table)方法进行编码 。 DC码表符号举例 压缩数据符号时,霍夫曼编码器对出现频度比较高的符号分配比较短的代码,而对出现频度较低的符号分配比较长的代码。这种可变长度的霍夫曼码表可以事先进行定义。 Value SSS -1, 1 1 -3,-2, 2,3 2 -7..-4, 4..7 3 如果DC的值(Value)为4,符号SSS用于表达实际值所需要的位数,实际位数就等于3。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
基于DCT的算法举例 3. 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
基于DCT的算法举例(cont.) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
基于DCT的扩展编码 4. JPEG的扩展编码系统 顺序编码模型(sequential encoding model) 自上而下,从左至右方式发送。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
基于DCT的扩展编码 (cont.) JPEG的扩展编码系统 (续) 累进编码模型(Progressive encoding) 采用多扫描(multiple scans) 图像部分信息分阶段传输,这些信息被接收后立即解码。 如果觉得不满意图像的内容,可立即停止传输。 适合于在低带宽信道上传输高分辨率的图像 累进编码有频谱选择与按位逼近两种方法,前者第一次扫描时只对DC系数某些频带的系数进行编码、传送,在随后的扫瞄中对其他频带编码、传送,直到全部系数传送完为止。分组选择方式如(0,1,2), (3,4,5), …。后者沿着量化系数的有效位(量化精度位数)方向分段累进编码,假设量化精度为8位,则第一次传送高4位,然后传送低4位。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
基于DCT的扩展编码 (cont.) JPEG的扩展编码系统 (续) 层次编码模型(Hierarchical encoding model) 采用多分辨率方式编码 这种编码模型特别适合多用户环境,且设备的分辨率各不相同。例如: 高分辨率的设备为2048×2048像素 HDTV监视器为1024×1024像素 低分辨率TV为512×512像素等 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG 2000简介 §3.4.4 JPEG 2000 is a new image coding system that uses state-of-the-art compression techniques based on wavelet technology. Its architecture should lend itself to a wide range of uses from portable digital cameras through to advanced pre-press, medical imaging and other key sectors. Cited from: http://www.jpeg.org/JPEG2000.html
JPEG 2000简介 JPEG 2000发展历程: 于1996年开始成立专门的小组(Maui会议) 1999年12月第一个草案(draft of part 1)形成 2000年8月Rochester会议时,ISO发布JPEG 2000国际标准最终草案(Final Draft International Standard),由ISO成员国中所有感兴趣的团体投票表决。 full International Standard于2000年12月最终通过,代号ISO/IEC 15444 Part 1 | ITU-T rec. T.800已经出版。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG 2000简介 (cont.) JPEG 2000的需求: 与JPEG兼容,连续色调,同时支持bi-level 低数据率 图像安全 累进传输(精度/分辨率)、实时顺序显示(build-up)能力 健壮的位错误(bit-error)纠正 基于内容的描述,随机存取(具备Regions-Of-Interest, ROI存取、压缩功能),具有与MPEG-4间的接口 能够处理大于64k×64k像素的图像 采用小波(Wavelet)变换算法。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
标准构成 JPEG 2000标准由下述部分组成: Part 1: Core coding system Part 2: Extensions Part 3: Motion JPEG2000 Part 4: Conformance Part 5: Reference Software Part 6: Compound image le format Part 7: Has been abandoned Part 8: JPSEC (security aspects) Part 9: JPIP (interactive protocols and API) Part 10: JP3D (volumetric imaging) Part 11: JPWL (wireless applications) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JEPG2000 Features Very high compression rate, sometimes even up to 200 times. JPEG completely breaks down at this rate. The size of the compressed file is controllable, That is, a user can specify the size of a file. Both lossy and lossless compression are supported in JPEG 2000. JPEG can produce only lossless images One can define Region Of Interest (ROI) in an image. The Region of Interest would be compressed to a higher quality than the rest of the image. One can have progressive decoding of an image in two ways – by resolution or, by quality. JPEG 2000 has a provision to add additional information about an image using XML. 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Region Of Interest Coding Original Image with ROI Defined Decoded Image with ROI Intact 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Progression Order Progression by Quality Layer 1 0.01 bpp Layer 2 0.1 bpp Layer 3 0.3 bpp Layer 4 1.0 bpp Improve decoding quality as receiving more bits 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Progression Order (cont.) Progression by Resolution 64x64 128x128 256x256 Res 0 0.01 bpp Res 1 0.034 bpp Res 2 0.3 bpp Multi-resolution decoding from one bit-stream 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG 2000 Vs. JPEG JPEG 2000 JPEG Better image quality as Wavelet Transforms do not have the ringing effect Lossless Compression Higher compression rates More features and flexibility Degraded Image Quality as DCT transform has the ringing effect Lossless Compression is not possible in JPEG More compression at the cost of Image quality Less Flexibility 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG 2000 Vs. JPEG (cont.) DCT 8x8 Quantization Table Huffman Coding Discrete Cosine Transform 8x8 Quantization Table Huffman Coding JPEG Transform Quantization Entropy Coding DWT Discrete Wavelet Transform Quantization for each sub-band Arithmetic Coding J2K 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
JPEG 2000 Vs. JPEG (cont.) JPEG 2000 (1.83 KB) Original (979 KB) 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Discrete Wavelet Transform 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Wavelet Transform 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
2D Separate DWT 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Coding Based on bit-plane Three passes Significant Propagation Pass Magnitude Refinement Pass Cleanup Pass 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
BIT PLANES 20 2N-1 2N-2 MSB LSB 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Bit-plane Coding 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
A. 参考文献 JPEG 2000标准草案:ISO/IEC FCD15444-1: 2000 | ITU-T Rec. T.800. (Part I ~ XIII.) Gregory K. Wallace. The JPEG Still Picture Compression Standard. Communications of the ACM. 1991, 34(4): 30 ~ 44. A. Skodras, C. Christopoulos, and T. Ebrahimi. JEPG2000 Still Image Compression Standard. IEEE Signal Processing Magazine, 2001. 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
专著 专著名:JPEG 2000: Image Compression Fundamentals, Standards and Practice 出版社:Kluwer International Series in Engineering and Computer Science, Secs 642 作 者:D. S. Taubman, M. W. Marcellin 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
§3.5 计算机动画基础 计算机动画是在传统动画的基础上,使用计算机图形图像技术而迅速发展起来的一门高新技术。动画使得多媒体信息更加生动,富于表现。广义上看,数字图形图像的运动显示效果都可以称作为动画。在MPC机上可以很容易地实现简单动画。
3.5.1 概述 3.5.2 动画原理 3.5.3 计算机动画(二、三维动画,变形动画) 3.5.4 计算机动画设计 内容提纲 3.5.1 概述 3.5.2 动画原理 3.5.3 计算机动画(二、三维动画,变形动画) 3.5.4 计算机动画设计
参考文献及资源 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
本小节主要介绍: 动画(Animation)技术的发展历史 计算机动画的主要研究内容。 计算机动画制作软件简介。 §3.5.1 计算机动画概述 本小节主要介绍: 动画(Animation)技术的发展历史 计算机动画的主要研究内容。 计算机动画制作软件简介。
动画历史 从实物到卡通 从卡通到数字化(图形、图像) 从数字化计算机动画 计算机动画是数字媒体的一个重要组成部分。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) 走马灯 原理: 灯中点上蜡烛。 利用空气动力,气流上升驱动叶轮(一些 类似于叶轮的机制)。 静止画面的连续播放。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) 计算机动画 与图形学、数字图像处理、运动学有密切的关系。 一般制作过程 二维图形 关键帧 运动路径 场景渲染 计算机动画有较长的发展历史,它与电影、电视有不解之缘。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) 计算机动画与电影 70年代 在电影中使用计算机动画的构想对许多导演来说仍旧是一个梦,但当时的电视节目已经开始尝试用一些简单的计算机动画技术来增强节目的效果了。 1973年举行了第一届SIGGRAPH(计算机图形特别兴趣小组)展览。当时的“重头戏”是一些用计算机制作的简单物体的模型,比如一个虚拟的茶壶和一只甲壳虫模型。 从那时起,人们开始进行早期的试验,利用CGI技术制作一些短影片。但由于这些制作员不是电影制片出身,因此早期的动画效果简直可以用“惨不忍睹”来形容。 尽管CGI短片一败涂地,但并没有浇灭好莱坞对动画技术的热情。 1976年英国伦敦的系统仿真公司(Systems Simulation, Ltd.)接受委托,为影片《异形》(Alien)中的登陆片段制作CG图形,纯计算机动画已开始在影片中使用。一位日后在好莱坞名声显赫的人物乔治·卢卡斯(George Lucas)洞悉CG技术的未来,组建了自己的CG部门,他所网罗的一批专家成立了日后如雷贯耳的ILM公司(Industrial Light & Magic)。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) 电影与计算机动画 80年代 80年代初,逐渐提高的计算机硬件性能赋予了计算机动画人员开发新的CG软件和技巧的自由。 分形算法(Fractual)等数学公式已经开始用于制作逼真的地理形貌。 “光线跟踪”(Ray Tracing)的技术被用于绘制那些实际生活中被光线照亮的物体。 迪斯尼在1980年发行了一部叫《Tron》的影片,片中使用了30分钟的计算机动画,包括一段高科技的摩托车赛的片段。 1985年,计算机动画技术已有了长足的进步,这时第一次出现了CGI电影角色,标志着业界的一次重大飞跃。由巴瑞·李文逊执导的《青年福尔摩斯》(Young Sherlock Holmes) 中有一段令人难以忘怀的片段:一扇彩色玻璃窗突然获得人性活了过来,与一位被它吓得魂飞魄散的牧师对话。这是一次破天荒的CGI成功的片段,是由乔治·卢卡斯刚成立的ILM公司花了6个月才制作完成的。该片段在影片中持续播放了30秒钟。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Fractal图片欣赏 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
Ray Tracing 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) 1986年,ILM公司属下的CG部门的大部分人马离开ILM,成立了Pixar制片厂,这家制片厂由苹果公司的总裁史蒂夫·乔布斯(Steve Jobs)所拥有。在Pixar,一些头脑活跃的人物,如约翰·拉萨特研究如何改进CG动画技术,把它作为一种讲述故事的手段,于是1988年影片《罐头总动员》(Tin Toy)应运而生。这部短片讲述了一只发条玩具和小孩之间的故事,成为第一部获得奥斯卡奖(最佳动画短片奖)的计算机动画影片。 1988年卢卡斯电影公司(LucasFilm)在荣·霍伍德(Ron Howard)执导的影片《Willow》中引入了一种新的CG技术“图像变形”(或称“幻影化”),取得了很好的效果。现在的图像变形技术已经有了很大的改进,可以让角色不露痕迹地变化形状,或者从一种样子变形成为另一种模样。 1989年,导演詹姆斯·卡麦隆(James Cameron)决定试验CGI到底能为影片做些什么。当时卡麦隆正在制作水下科幻影片《深渊》(The Abyss),他跑到ILM和Pixar两家著名的CG公司兜售他的奇妙构思,希望制作一只能模仿影片中演员的面部表情和动作的蛇状水怪。后来ILM投标胜出,制作出了传统方法不能企及的惊人效果。事实上CG已经将导演的梦想变成了现实。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) 电影与计算机动画 90年代 20世纪最后10年,计算机动画在好莱坞掀起一场电影技术的风暴。 卡麦隆在影片《深渊》试验了CG的可行性之后,决定再朝前迈出一大步。而这一步却永远改变了好莱坞电影的视觉效果。他导演的《终结者2:审判日》(Terminator2 Judgment Day)创下了非凡的票房佳绩,全球5.14亿美元的收入。影片的成功要归功于屏幕上的那些创意新颖的角色。卡麦隆设计的T-1000一个追赶主角的穷凶恶极的液态金属机器人可以从一种形状神奇地变化成另外一种形状。ILM为《终结者2》制作了超过100个CG素材,在影片中足足占据了五分半钟。 迪斯尼向人们证明了CG的应用范围不仅仅局限在科幻、爆炸等题材的电影中。 1991动画影片《美女与野兽》(Beauty and The Beast)(第一部而且是唯一的一部被提名为奥斯卡最佳影片奖的动画片)、《FernGully》 1992、《埃及王子》(Prince of Egypt) 1998、《钢铁巨人》(The Iron Giant) 1999等。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) Jurassic Park 1991年,导演斯皮尔伯格开始制作影片《侏罗纪公园》 。显然这部刻画会跑、会跳、神气活现的恐龙的影片,对特技效果的要求特别高。一开始斯皮尔伯格设想完全采用传统的效果技巧来制作影片中无数的特技镜头,比如用历史悠久的Stop Motion间隔拍摄法。但当他看过由ILM的斯坦·温斯顿带领的一组计算机动画人员制作的CG恐龙片断后,他改变了主意。 ILM发明了一种新鲜玩意儿叫做恐龙输入设备DID给传统制作动画人员摆弄和移动恐龙模型。他们移动设备时,恐龙的动作被发送至计算机,实时地调整屏幕上的CG恐龙模型。结果,一部从未想到过使用计算机图像集合而成的电影,却包含了超过50个CGI片段。尽管CGI的数量不算多,影片的大多数场景仍旧使用传统的动画技术,但斯皮尔伯格清楚地意识到,CGI在创建形态逼真的动物方面要远远胜过传统的拍摄技术。在《侏罗纪公园》的续集《失落的世界》The Lost World中,CG取代了传统的动画模型,几乎在每一个特技镜头中出现。 Jurassic Park 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) Toy Story 1995年,Pixar制片厂打算尝试一件电影业界从来没有做过的事情:制作一部完全由CG创作的电影。这部影片就是《玩具总动员》(Toy Story),它以区区3000万美元的投资,赚取了3.5亿美元的全球票房收入,影片还获得了奥斯卡最佳剧本奖的提名。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画历史 (cont.) 电影与计算机动画 未来 计算机动画的未来没有止境。 一些最有创意的人们正不断开发能让动画人员控制和处理3D模型和效果的新软件。 导演和编剧也开始采用这种新的手段来叙述剧情,计算机动画技术的完善赋予了他们新的构思空间。 未来CGI将要不断探索的一个领域将是“虚拟演员”。 一部即将问世的新影片将试图回答这个问题。它就是《最终幻想》(Final Fantasy) 。它是第一部完全3D动画的影片,栩栩如生的角色看起来像真人一样。这些角色是结合了运动捕获Motion Capture,即真实演员连系着一台计算机,他的动作被计算机记录下来,用于创作影片人物逼真的运动效果和3D脸部扫描演员的脸部被扫描进入计算机,无缝隙地添加到CGI模型上两种技术来实现的。 在未来我们将看到什么样的电影?他们说,在CGI的世界里,任何惊险、恐怖的场景实现都将是轻而易举的。 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
主要研究内容 动画技术 Toolkits Record Animation Computer Generated Animation Cell Animation Stop Motion Motion Capture Optical Motion Capture Others Computer Generated Animation Motion Control Key Frame Kinematics Dynamics Toolkits 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画软件 (cont.) 二维 Alchemy Mindworks 的GIF Construction Set http://www.mindworkshop.com 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画软件 (cont.) 三维 3D Studio 的3D MAX http://www.3dmax.com/ 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画软件 (cont.) Flash 动画演示 Flash 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术 http://flash.7yin.com/517k_swf/2005/8/30/200583073507212.swf 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
动画软件 (cont.) Morph http://www.morpheussoftware.net/ 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术
参考文献 ACM SIGGRAPH Symposium on Computer Animation. 2002: July 21-22, 2002, San Antonio, Texas. http://sca2002.cs.brown.edu/ 2003: July 26 - 27, 2003. San Diego, California http://gamma.cs.unc.edu/SCA03/ http://www.cs.washington.edu/research/graphics.intro.html 2018年9月21日2018年9月21日 第三章 图形、图像与视频处理技术