第十章 模糊图像变换编码 指导教师:高新波 学 生: 王来雄 2 0 0 3 年 1 2 月
第十章 模糊图像变换编码 1 图像编码的目的 2 图像压缩编码的方法 3 模糊图像变换编码
1图 像 编 码 的 目 的 图像编码是为了压缩数据量巨大的图像信息,以利于图像的传输,存储, 处理和交换。 而图像内数据之间存在大量冗余, 使得图像压缩编码成为可能。
2 图 像 压 缩 编 码 的 方 法
2 图 像 压 缩 编 码 的 方 法 (1)预测编码是利用相邻像素的相关性进行预测.预测编码通常不是直接对信号编码,而是对预测误差编码.当预测比较准确,误差较小时, 可达到编码压缩的目的.这种编码被称为差分脉冲编码(DPCM).
2 图 像 压 缩 编 码 的 方 法 (2)正交变换编码由三部分组成,即图像输入与变换, 编码,逆变换. 在变换阶段,系统将原图分成若干子块, 对每个子块进行某种正交变换. 通过变换, 降低或消除相邻象素之间或相邻扫描行之间的相关性, 提供了用于编码压缩的变换系数矩阵. 编码过程实现图像信息的压缩. 统计表明, 在变换域中, 图像信号的绝大部分集中在低频部分, 编码中如果略去那些能量很小的高频成分, 或者给那些高频成分分配较少的比特数, 就可以大幅减少图像传输或存储的数据量. 常见的正交变换有K-L变换, DFT变换,Walsh-Hadamard变换及DCT等.
2 图 像 压 缩 编 码 的 方 法 (3) 统计编码是根据信源的概率分布特性, 分配可变长的码字(其具有唯一可译性)进行编码.常见的统计编码有Huffman编码, 算术编码等. JPEG先经DCT, 然后作Huffman编码。 (4) 矢量量化编码是将K个(K>=2)样值形成一个K维空间中的一个矢量, 然后对此矢量进行一次量化, 只传输或存储矢量的地址. 因此能大大地提高压缩比. 矢量量化总是优于标量量化, 这是因为矢量量化有效地利用了矢量中各分量间地四种相关性(线性依赖性, 非线性依赖性, 概率密度函数的形状和矢量维数)来去除多余度. 矢量量化是标量量化的多维扩展.
2 图 像 压 缩 编 码 的 方 法 (5) 小波变换编码的本质是多分辨率或多尺度地分析信号,适合人眼视觉分辨率的不均匀性.小波变换的优点是分辨率高, 无方块效应. JPEG2000采用了LeGall5/3 和Daubechies9/7小波。 由Shapiro提出的EZW(embedded zero-tree wavelet)算法, 不仅具有较高的编码效率, 而且在不损失编码效率的前提下能够产生嵌入式码流, 支持多码率解码. 彭进业提出了一种改进型的自适应嵌入式零树小波图像编码方法, 利用自适应的小波系数, 增加了编码过程中的零树个数, 提高了编码效率.
2 图 像 压 缩 编 码 的 方 法 (6) 分形编码利用了自然物体(比如云, 森林远景等)结构上的自相似性,而这种自相似性是图像整体与局部相关性的表现.首先对图像进行分块, 然后再寻找各块之间的相关性, 相关性的描述主要是依靠仿射变换来确定,一旦找到了每块的仿射变换, 就保存下此放仿射变换的系数, 由于仿射变换的系数量远小于每块的数据量, 因而图像得以大幅度的压缩. 但分形编码一般只适用于自然物体. 罗强提出一种基于分形几何形状比例可变的分形图像编码方法, 以分形几何比例分别为2:1和3:2的最佳父块逼近子块程度的实验为例, 得出父块越大, 父块逼近子块程度越差的结论. 表明, 分形几何比例可变的混合分形编码方法与其它单一几何比例分形编码方法相比, 图像的压缩率和峰值信噪比均有提高, 编码时间也有所减少.
2 图 像 压 缩 编 码 的 方 法 (7) 模型基编码的基本思想: 构造一个用二维图像编码序列表达三维被视景物的模型, 用该模型去分析/合成图像. 这种编码是建立在对图像信息的理解之上的, 其编码过程是对图像的分析过程,而其解码过程是对图像信息的合成过程.
3 模糊图像变换编码 Decoding x1 自适应DCT编码框图 X DCT Coding Subimage Classifiction channel X x1 Decoding DCT Coding Subimage Classifiction 自适应DCT编码框图
3 模糊图像变换编码 (1)将Lena图像划分为16x16的子图像,并分别对各子图像进行离散余弦变换(DCT): 其中c(0)=1/2,c(k)=1 for k=1,2….N-1
3 模糊图像变换编码 (2)计算各子图的AC能量T及AC的低频能量L: DC对应于图像的主要能量 AC对应于图像的边缘和噪声
3 模糊图像变换编码 (3)采用微分竞争学习(DCL)的神经网络,对输入输出积空间的向量聚类,从而估计FAM规则: if the jth neuron wins if the jth neuron loses
3 模糊图像变换编码 其中的向量,即每个训练样本,由(T,L,B)组成,这些数据来自于陈系统. T代表整个AC的能量,分为4个等级:BG,MD, SL和VS L代表AC的低频能量, 分为2个等级:SM和LG 输出变量为B, 分为4个等级: BG,MD, SL和VS
3 模糊图像变换编码 Figure 10.2 Fuzzy-set values of fuzzy variables T,L,and B.
3 模糊图像变换编码 将L(0<L<100)分为两个非重叠的区间[0,9.88], [9.88,100],对应于SM,LG。 训练时,根据隶属度函数,将T(0<T<100)分为四个非重叠的区间[0,8.76],[8.76,16.19],[16.19,27.94],[27.94,100]。这四个区间对应于模糊集的值 VS,SL,MD,BG。 将L(0<L<100)分为两个非重叠的区间[0,9.88], [9.88,100],对应于SM,LG。 将B(0<B<4.5)分为四个非重叠的区间[0,8.76],[8.76,16.19],[16.19,27.94],[27.94,100]对应于HI,MH,ML,LO。
积空间聚类,估计FAM规则 DCL将陈系统产生的256个输入输出向量聚类到32个FAM单元中. 当一个向量落入某个FAM单元时, 就将该单元所对应的FAM规则加到FAM系统中.这样,就得到了上面规则的1,2,6,7,8条,根据经验补上其中的3,4,5条使规则完整。
3 模糊图像变换编码 (4)根据所得到的FAM规则,进行联想。联想时可以选择最小相关法或积相关法。前者相当于输入对输出模糊集的剪平; 后者相当于输入对输出模糊集的尺度化。 然后将多条规则的联想结果进行线性组合,得到B。最后采用最大值法或质心法进行去模糊,得出子图像所属的类别。
模糊联想记忆 FAM Rule 1 FAM Rule 2 解模糊 FAM Rule m FAM 系统
3 模糊图像变换编码 (5)根据所得到的子图像所属的类别,和陈系统的4类子图的位映射模板,分别对各子图进行压缩编码.原则是某子图的AC能量越高,则编码时分配给此子图的总比特数越多;在子图内部, DCT系数的频率越低,分配给此系数的比特数越多。
3 模糊图像变换编码 使用如下的信噪比来评估编码后图像的质量: 其中 表示重建误差的随机样本方差
3 模糊图像变换编码 定义平均编码的bits/pixel R: 表示用于图像编码的总比特数,N表示图像的大小。
文中比较了陈系统和FAM系统的性能,FAM系统拥有较好的信噪比和压缩比。 3 模糊图像变换编码 文中比较了陈系统和FAM系统的性能,FAM系统拥有较好的信噪比和压缩比。 文中使用Lena 图像的训练数据进行估计的FAM系统,对F-16战斗机图像进行编码,结果表明其压缩达到 0.5 bits / pixel时,性能依然很好,
3 模糊图像变换编码 FAM和陈系统的性能对比: SNR (db) R Comp. ratio Lenna FAM Chen 28.24 SNR (db) R Comp. ratio Lenna FAM Chen 28.24 28.10 0.963 0.976 8.3:1 8.2:1 25.72 25.68 0.504 0.528 15.9:1 15.1:1 F--16 26.35 26.02 0.898 8.9:1 24.56 24.41 0.435 18.4:1
结 论 FAM系统比陈系统有较好的性能,且二者输入输出行为也很近似。理论上,可以把这种能够产生规则的非监督技术,用于任意图像和信号处理的问题。
谢 谢 !