第三章信源编码（一）离散信源无失真编码.

Slides:

Advertisements

Similar presentations

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

全微分教学目的：全微分的有关概念和意义教学重点：全微分的计算和应用教学难点：全微分应用于近似计算.

信号与系统第三章傅里叶变换东北大学 2017/2/27.

《解析几何》－Chapter 3 §7 空间两直线的相关位置.

信息论复习.

第一章引论.

圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

第三章函数逼近 — 最佳平方逼近.

第三章数据类型和数据操作对海量数据进行有效的处理、存储和管理 3.1 数据类型数据源数据量数据结构

《高等数学》（理学）常数项级数的概念袁安锋

§1 线性空间的定义与性质 ★线性空间的定义 ★线性空间的性质 ★线性空间的子空间线性空间是线性代数的高等部分，是代数学

常用逻辑用语复习课李娟.

第四章网络营销战略战略计划是企业的生命线，是企业一切工作都必须遵循的总纲。我们经常说,做对的事情比把事情做对更重要，就是这个道理。美国一位总裁曾说：每天我总要花部分时间来思考的事情是企业未来10年的事情。在日本的一次调研中，90％的企业家认为：最占时间、最为重要、最为困难的事情就是制定战略计划。可见，企业需要战略，没有战略计划指导的企业是很容易迷路的，迷了路的企业很难不误入歧途，误入歧途的企业，失败则是必然的。

一、原函数与不定积分二、不定积分的几何意义三、基本积分公式及积分法则四、牛顿—莱布尼兹公式五、小结

§5.3 定积分的换元法和分部积分法一、定积分的换元法二、定积分的分部积分法三、小结、作业.

第5章定积分及其应用基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法

定积分习题课.

第三节格林公式及其应用（2）一、曲线积分与路径无关的定义二、曲线积分与路径无关的条件三、二元函数的全微分的求积四、小结.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

2-7、函数的微分教学要求教学要点.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第5章 §5.3 定积分的积分法换元积分法不定积分分部积分法换元积分法定积分分部积分法.

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

第二章矩阵(matrix) 第8次课.

第三章信源编码（一）离散信源无失真编码.

第十章方差分析.

第一章函数与极限.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

实数与向量的积.

概率统计主讲教师叶宏山东大学数学院.

线性代数厦门大学线性代数教学组 2019年4月24日6时8分 / 45.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

人教版高一数学上学期第一章第四节绝对值不等式的解法(2)

1.2 有理数第1课时有理数伏家营中学付宝华.

第4章 Excel电子表格制作软件 4.4 函数（一）.

正切函数的图象和性质周期函数定义：一般地，对于函数 (x),如果存在一个非零常数T，使得当x取定义域内的每一个值时，都有

定理21.9(可满足性定理)设A是P(Y)的协调子集，则存在P(Y)的解释域U和项解释，使得赋值函数v(A){1}。

第16讲相似矩阵与方阵的对角化主要内容： 1.相似矩阵 2. 方阵的对角化.

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

1.2 子集、补集、全集习题课.

1.设A和B是集合，证明：A=B当且仅当A∩B=A∪B

第三章　函数的微分学第二节　导数的四则运算法则一、导数的四则运算二、偏导数的求法.

第4课时绝对值.

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

高中数学必修平面向量的基本定理.

第五章信道编码定理.

第五章信道编码定理.

§2 方阵的特征值与特征向量.

难点：连续变量函数分布与二维连续变量分布

9.5空间向量及其运算 2.共线向量与共面向量淮北矿业集团公司中学纪迎春.

第三节函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.

基于列存储的RDF数据管理朱敏

第四节向量的乘积一、两向量的数量积二、两向量的向量积.

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

数据表示第 2 讲.

第三节数量积向量积混合积一、向量的数量积二、向量的向量积三、向量的混合积四、小结思考题.

§4.5 最大公因式的矩阵求法（ Ⅱ ）.

第三章线性方程组 §4 n维向量及其线性相关性（续7）

第二次课后作业答案函数式编程和逻辑式编程

一元一次方程的解法(－).

最小生成树最优二叉树.

§2 自由代数定义19.7:设X是集合，G是一个T-代数，为X到G的函数,若对每个T-代数A和X到A的函数，都存在唯一的G到A的同态映射,使得=，则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变， 变 变， 也变对给定的 和A，是唯一的.

学习目标 1、什么是列类型 2、列类型之数值类型.

Presentation transcript:

第三章信源编码（一）离散信源无失真编码

3.1信源及其分类 3.2离散无记忆信源的等长编码 3.3离散无记忆信源的不等长编码 3.4最佳不等长编码

3.1 信源及其分类

信源及其分类离散信源连续信源无记忆信源有记忆信源简单信源－独立同分布平稳信源，各态历经源 M阶记忆源时间离散连续源随机波形源

3.2 离散无记忆源的等长编码

离散无记忆源字母表A={a1,…,aK},概率分别为p1,…,pK,长为L的源输出序列uL={u1,…,uL}，共有KL种序列码符号字母表B={b1,…,bD},以码符号表示源输出序列，D元码等长D元码，不等长D元码的个数单义可译码，每个消息都至少有一个码字与之对应。单义等长可译码存在充要条件DN≥KL 由此可得，N≥LlogK/logD

DMS的等长编码 NlogD≥LH(U) H(U)是统计平均值，L达到无限时，一个具体的源输出序列的平均每符号的信息量才等于H(U) 选L足够长，使 NlogD≥L[H(U)+eL] L趋向于无穷，eL趋向于0，保证不降低效率。不能保证单义可译，但可以保证非单义可译引起的误差可以渐进的任意小。如何证明？

弱、强e典型序列集定义3.2.1：令H(U)是集{U, p(ak)}的熵，e是正数，集合定义为给定源U输出的长为L的典型序列集。定义为给定源输出的长为L的e－典型序列集，其中Lk 是在L长序列中符号ak出现的次数 ——强e-典型序列集

例3.2.2 典型二项序列出现的概率：当L足够大，

信源划分定理定理3.2.1:给定信源｛U, p(ak)｝和e>0,当L∞，Pr{T(L, e)}1,或对所有e>0，存在有正整数L0，使得当L>L0时有

信源划分定理系1：特定典型序列出现的概率若uL∈TU(L,e),则

信源划分定理典型序列的数目：系2：当L足够大时，对于给定的信源和e>0,典型序列的个数｜TU(L,e)｜满足

信源划分定理信源消息可以分为2组：（渐进等同分割性） 1、典型序列高概率集，渐进等概序列，AEP序列 2、非典型序列低概率集

编码速率和等长编码定理编码速率：R=(1/L)logM=(N/L)logD, M为码字总数可达速率：对于给定信源和编码速率R以及任意e>0，若有L0,以及编译码方法，使得L>L0,错误概率小于e，R是可达的等长编码定理： R>H(U),R是可达的，R<H(U)，R是不可达的编码效率：h=H(U)/R

3.3 DMS的不等长编码

平均码长

不等长编码面临问题同步问题划分唯一性译码延迟缓存问题

几个定义唯一可译码逗点码，无逗点码字头或前缀异字头码或异前缀码树码，满树，非满树，全树树码构造异字头码

例子信源字母集概率码A 码B 码C 码D a1 a2 a3 a4 0.5 0.25 0.125 1 10 00 11 110 111 1 10 00 11 110 111 01 011 0111

例观察表3.3.1。码A不是唯一可译的。码B不是唯一可译的。码C是唯一可译的，识别码字的方法为：见“0”或“111”就是一个码字的结束。实际上，码C是异字头码。码D是唯一可译的，识别码字的方法为：见“0”就是一个码字的开始。实际上，码D是逗点码，其中“0”是逗号。码C不是逗点码。码D不是异字头码。码C的平均码长比码D的平均码长小：码C的平均码长为1×0.5+2×0.25+3×0.125+3×0.125=1.75；码D的平均码长为1×0.5+2×0.25+3×0.125+4×0.125=1.875。

异字头码的第一种构造方法：Shannon-Fano编码法（D元编码，字母表为{0, 1, …, D-1}）（1）将源随机变量的事件按概率从大到小排成一行。（2）将此行切分为D段，分别赋予标号“0”到“D-1”，称为1级标号。（3）将每个非空段再切分为D段，分别赋予标号“0”到“D-1”，称为2级标号。（4）将每个非空段再切分为D段，分别赋予标号“0”到“D-1”，称为3级标号。如此一直到每个段均含有至多一个事件为止。此时，一个事件的码字就是这个事件所在的段的标号序列，从1级标号到末级标号。为了使平均码长小，每次切分段时应使D段的概率尽可能相近。（注解：当然可以把“切分段”操作换为“任意分组”操作，使D组的概率尽可能相近。这样可以使平均码长更小。但是，这不是一种有效的操作。）

Shannon－Fano编码异字头码可以通过树图构成 D元码将信源符号按出现概率从大到小排列每次信源符号化为概率近似相等的D个子集这样可以保证D个码元近似等概，每个码字承载的信息量近似最大，码就近似最短。理想情况I(ak)=nklogD, p(ak)=D-nk

异字头码存在的充分必要条件 Kraft不等式定理3.3.1: 长度为n1,n2,…,nk的D元异字头码存在的充分必要条件是：异字头码不唯一，且满足上式的码不一定是异字头码

唯一可译码定理3.3.2：唯一可译码必然满足Kraft不等式系：任一唯一可译码可用各相应码字长度一样的异字头码代替

不等长编码定理

关于不等长编码的几个概念不等长编码的速率：不等长编码的效率：h=H(U)/R 码的多余度：1-h

3.4最佳不等长编码

两个定理 1.对于给定信源，存在最佳唯一二元可译码，最小概率的两个码字码长相等且最长，他们之间仅最后一位不同 2. 对辅助集为最佳的码，对原始集也是最佳的

二元Huffman编码 1、将符号（符号序列）概率从大到小排列 2、最后的2个符号分别分配为0，1 3、将最后的2个符号的概率值相加，合并起来作为一新的符号 4、重复第一步骤

Huffman编码例(0.20,0.19,0.18,0.17,0.15,0.10,0.01)

Huffman编码若pj>pk，则nj≤nk 最长的2个码字码长相同最长的2个码字除了最后一位不同外其余位置的值都相同

多元Huffman编码 number = 1＋k (D - 1)

LZ编码是否存在编码方法与信源的统计特性无关？基于字典编码的基本原理定长码 LZ编码：适用于长消息序列的编码，信源符号间既可以相互独立也可以有一定的相关性，当消息序列较短时，码字可能不能达到压缩的目的，但当消息序列很长时，LZ编码方法相对于只对典型序列进行编码，因此压缩效果比较好，而且实际应用也很多。如计算机文件压缩。

Eg：对下面信息序列进行LZ编码10101101001001110101000011001110101100011011 分段phrases：1, 0, 10, 11, 01, 00, 100, 111, 010, 1000, 011, 001, 110, 101, 10001, 1011

序号字典位置字典内容码字 1 0001 00001 2 0010 00000 3 0011 10 00010 4 0100 11 00011 5 0101 01 00101 6 0110 00 00100 7 0111 100 00110 8 1000 111 01001 9 1001 010 01010 1010 01110 1011 011 01011 12 1100 001 01101 13 1101 110 01000 14 1110 101 00111 15 1111 10001 10101 16 11101

游程编码信源产生消息具有相关性，同一个消息连续输出的个数称为游程对信源序列BBBBBBXXXXXXXAAAAAAAAJJJJJJJJJJJ编码，可得到码序列：B#6X#7A#8J#11

算术编码 Huffman编码的局限性算术编码无需计算信源序列分布，直接对信源符号序列编码，可达到渐进最佳性能思想：计算输入信源符号序列所对应的区间，在区间内任取一点，以其二进制表示适当截断作为序列的编码结果例题1：设无记忆源U={0，1},其概率分布矢量为{0.25, 0.75}。对信源序列u=11011101做算术编码例题2：无记忆信源U={1,2,3,4}，概率矢量｛0.5,0.25,0.125,0.125}，对信源序列21134121算术编码

算术编码经过算术编码，上例题的结果为1000011，用7比特的码字表示了8比特的信息

算术编码 1、初始化：起点P＝0，宽度A＝1 2、如码元全部处理，转第五步 3、读入的码元为0，区间的起点P不变，宽度缩短为Ap,用公式P=P，A=Ap迭代计算，转第二步 4、读入的码元为1，区间的起点右移Ap，宽度缩短为A(1-p)，用公式P=P+Ap，A=A(1-p)迭代计算，返回第二步 5、根据区间的最终宽度A，通过2-L≤A<2-(L-1)求得码字长度，将区间起点P截取小数点后L位，剩余部分若不为0，进位到小数点后第L位

Eg：s=011，说明U＝（000, 001, 010, 011, …, 111）, 所以若若所以其中

Eg：s=11111100，p(0)=1/4, p(1)=3/4, 所以有H(u)=0.81bit/符号；，

A：通过计算来编码， F(s)=p(00000000)+p(00000001)+…+p(11111011) =1-p(11111111)-p(11111110)-p(11111101) -p(11111100)=1-p(1111111)-p(1111110) =1-p(111111) =1- =0.110100100111 所以C(s)=0.1101010

B：用递推公式编码输入符号 P(s) L(s) F(s) C(s) 1 0.11 0.01 0.1 0.1001 0.0111 0.011011 2 0.100101 0.01010001 0.10100111 0.0011110011 3 0.1100001101 0.111 0.001011011001 0.110100100111 0.00001011011001 5 0.11011 0.0000001011011001 7 0.1101010

C：用〔0,1）区间表示

第三章结束