Information Theory and Coding Techniques 信息论与编码技术
Where there is a will, there is a way.
第一章 绪论
信息论 通信技术 概率论 随机过程 数理统计 相结合逐步发展而形成的一门新兴科学 奠基人:美国数学家香农(C.E.Shannon) 1948年“通信的数学理论” 本章内容: 信息的概念 数字通信系统模型 信息论与编码理论研究的主要内容及意义
1.1 信息的概念 信息是信息论中最基本、最重要的概念,既抽象又复杂 信息在日常生活中被认为是“消息”、“知识”、“情报”等 “信息”不同于消息(在现代信息论形成之前,信息一直被看作是通信中消息的同义词,没有严格的数学含义),消息是表现形式,信息是实质; “信息”不同于情报,情报的含义比“信息”窄的多,一般只限于特殊的领域,是一类特殊的信息; 信息不同于信号,信号是承载消息的物理量; 信息不同于知识,知识是人们根据某种目的,从自然界收集得来的数据中整理、概括、提取得到的有价值的信息,是一种高层次的信息。
消息:用文字等能够被人们感觉器官所感知的形式,把客观物质运动和主观思维活动的状态表达出来。 知识:一种具有普遍和概括性质的高层次的信息 ,以实践为基础,通过抽象思维,对客观事物规律性的概括。 情报:是人们对于某个特定对象所见、所闻、所理解而产生的知识 。 它们之间有着密切联系但不等同 ,信息的含义更深刻、广泛
就狭义而言,在通信中对信息的表达分为三个层次:信号、 消息、信息。 信号:是信息的物理表达层,是三个层次中最具体的层次。 它是一个物理量,是一个载荷信息的实体,可测量、可描述、 可显示。 消息:(或称为符号)是信息的数学表达层,它虽不是一个 物理量,但是可以定量地加以描述,它是具体物理信号的进 一步数学抽象,可将具体物理信号抽象为两大类型: 离散(数字)消息,一组未知量,可用随机序列来描述: X=(X1…Xi…Xn) 连续(模拟)消息,未知量,它可用随机过程来描述: X( t, ω) 信息:它是更高层次哲学上的抽象,是信号与消息的更高 表达层次。
信息、消息和信号是既有区别又有联系的三个不同的概念。 消息中包含信息,是信息的载体。 信号携带着消息,它是消息的运载工具。 信息可认为是由具体的物理信号、数学描述的消息的内涵,即信号具体载荷的内容、消息描述的含义。 而信号则是抽象信息在物理层表达的外延; 消息则是抽象信息在数学层表达的外延。 同一信息,可以采用不同的信号形式(比如文字、语言、图象等)来载荷;同一信息,也可以采用不同的数学表达形式(比如离散或连续)来定量描述。 同一信号形式,比如“0”与“1”可以表达不同形式的信息,比如无与有、断与通、低与高(电平)等等。
什么是信息 1928年,哈特莱(R.V.L Hartley) 局限性: 关于信息的科学定义,到目前为止,国内外已有不下百余种流行的说法,它们都是从不同的侧面和不同的层次来揭示信息的本质的。 1928年,哈特莱(R.V.L Hartley) 在《信息传输》一文中提出:发信者所发出的信息,就是他在通信符号表中选择符号的具体方式 局限性: 定义不涉及到信息的价值和具体内容,只考虑选择的方式。 即使考虑选择的方法,但没有考虑各种可能选择方法的统计特性。
1948年,维纳(N.Wiener) 在《控制论--动物和机器中通信与控制问题》一书中,指出:“信息是信息,不是物质,也不是能量”。将“信息”上升到“最基本概念”的位置。 后来,维纳在《人有人的用处》一书中提出:“信息是人们适应外部世界并且使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容的名称。” 局限性: 把信息与物质、能量混同起来。所以,维纳关于信息的定义是不确切的。
信息是事物运动状态或存在方式的不确定性的描述。 1948年,香农(C.E.Shannon) 发表了一篇著名的论文,“通信的数学理论”。 他从研究通信系统传输的实质出发,对信息作了科学的定义,并进行了定性和定量的描述。 信息是事物运动状态或存在方式的不确定性的描述。
通信系统模型 信源:产生消息和消息序列的来源。 信源编码器 信道编码器 调 制 器 信道 解 信宿 信源译码器 信道译码器 干扰 源 编码信道 信源:产生消息和消息序列的来源。 消息可以是离散的,也可以是连续的(数据、文字、语言、图像),通常信源的消息序列是随机发生的,因此要用随机变量来描述。
编码器:把消息变换成适合于信道传输的信号。 信源编码器:将信源的输出进行适当的变换,以提高信息传输的有效性。 信道编码器:对信源编码器的输出进行变换,用增加多余度的方法提高信道的抗干扰能力,以提高信息传输的可靠性。 调制器:将信道编码器输出的数字序列变换为振幅、频率或相位受到调制控制的形式,以适合在信道中进行较长距离的传输。 信道:信号由发送端传输到接收端的媒介。 典型的传输信道有明线、电缆、高频无线信道、微波通道和光纤通道等;典型的存储媒介有磁芯、磁鼓、磁盘、磁带等。
干扰源:对传输信道或存储媒介构成干扰的来源的总称。干扰和噪声往往具有随机性,所以信道的特征也可以用概率空间来描述;而噪声源的统计特性又是划分信道的依据。 干扰可以分为两类:1)加性干扰,它是由外界原因产生的随机干扰,它与信道中传送的信号的统计特性无关,因而信道的输出是输入和干扰的叠加;2)乘性干扰:信道的输出信号可看成输入信号和一个时变参量相乘的结果。 解调器:从载波中提取信号,是调制的逆过程 信道译码器:利用信道编码时所提供的多余度,检查或纠正数字序列中的错误。 信源译码器:把经过信道译码器核对过的信息序列转换成适合接收者接收的信息形式。 信宿:消息传送的对象 (人或机器 )。
通信的结果是消除或部分消除不确定性从而获得信息。 香农定义信息的局限性: 在通信系统中形式上传输的是消息,但实质上传输的是信息。消息只是表达信息的工具、载荷信息的客体。显然,在通信中被利用的(亦即携带信息的)实际客体是不重要的,而重要的是信息。 通信的结果是消除或部分消除不确定性从而获得信息。 香农定义信息的局限性: (1)定义的出发点是假定事物状态可以用一个以经典集合论为基础的概率模型来描述,在实际中要寻找一个合适的概率模型往往是非常困难的。有时是否存在这样一种模型还值得探讨。 (2)定义没有考虑收信者的主观特性和主观意义,不顾信息的具体含意、具体用途、重要程度和引起后果等因素。这就与实际情况不完全一致。其实,信息有很强的主观性和实用性。
某一事物状态的不确定性的大小,与该事物可能出现的不同状态数目以及各状态出现的概率大小有关。既然不确定性的大小能够度量,所以信息是可以测度的。 信息的测度:信息量与不确定性消除的程度有关。 用数学的语言来讲,不确定就是随机性,可运用研究随机事件的数学工具----概率论和随机过程来测度不确定性的大小。 某一事物状态的不确定性的大小,与该事物可能出现的不同状态数目以及各状态出现的概率大小有关。既然不确定性的大小能够度量,所以信息是可以测度的。 与信息测度相关的几个概念: 样本空间、概率空间 、先验概率 、自信息 、后验概率 、互信息
样本空间:所有可能选择的消息的集合(某事物所有可能出现的状态 ) 概率空间:一个样本空间和它的概率测度 可用[X,P]来表示 先验概率:选择符号 ai 作为消息的概率----P(ai) 自信息:ai 本身携带的信息量 后验概率:接收端收到消息(符号) bj 后而发送端发的是 ai 的概率 P(ai/bj) 互信息:收信者获得的信息量-----先验的不确定性减去尚存在的不确定性
如果信道没有干扰,信道的统计特性使 ai 以概率“1”传送到接收端。 这时,收信者接到消息尚存在的不确定性就等于零,即P(ai/bj)=1,log(1/ P(ai/bj))=0,不确定性全部消除。由此得互信息: 有关自信息和互信息的概念即为香农关于信息的定义和度量,通常也称为概率信息
信息具有以下特征: (1)信息是可以识别的 (2)信息的载体是可以转换的 (3)信息是可以存贮的 (4)信息是可以传递的 (5)信息是可以加工的 (6)信息是可以共享的
1.2 信息论研究的对象,目的,内容 一、 研究对象 前面介绍的统一的通信系统模型。人们通过系统中消息的传输和处理来研究信息传输和处理的共同规律。 二、研究目的 找到信息传输过程的共同规律,提高信息传输的可靠性、有效性、保密性和认证性,以达到信息传输系统的最优化。
可靠性 使信源发出的消息经过信道传输以后,尽可能准确地、不失真地再现于接收端。 有效性 经济性好,即用尽可能短的时间和尽可能少的设备来传送—定数量的信息。 保密性 隐蔽和保护通信系统中传送的消息,使它只能被授权接收者获取,而不能被未授权者接收和理解。 认证性 接收者能正确判断所接收的消息的正确性,验证消息的完整性,而不是伪造的和被窜改的。 有效性、可靠性、保密性和认证性四者构成现代通信系统对信息传输的全面要求。
三、 研究内容 对信息论的研究内容一般有以下三种理解。 狭义信息论(经典信息论):主要研究信息的测度、信道容量以及信源和信道编码理论等问题。这部分内容是信息论的基础理论,又称为香农信息论。 一般信息论(通信理论):主要是研究信息传输和处理问题,除了香农理论外,还包括噪声理论、信号滤波和预测、统计检测和估计理论、调制理论以及信息处理理论等。 广义信息论:广义信息论不仅包括上述两方面的内容,而且包括所有与信息有关的领域,如模式识别、计算机翻译、心理学、遗传学、语言学等等。
信息论是一门应用概率论、随机过程、数理统计和 近代代数的方法,来研究广义的信息传输、提取和 处理系统中一般规律的学科。 它的主要目的是提高信息系统的可靠性、有效性、 保密性和认证性,以便达到系统最优化; 它的主要内容(或分支)包括香农理论、编码理论、 维纳理论、检测和估计理论、信号设计和处理理论、 调制理论、随机噪声理论和密码学理论等。 本课程讨论香农信息理论
1.3 信息论发展简史与现状 信息论是在长期的通信工程实践和理论研究的基础上发展 起来的。 一、简史 1.3 信息论发展简史与现状 信息论是在长期的通信工程实践和理论研究的基础上发展 起来的。 一、简史 现代信息论实际上是从20世纪20年代奈奎斯特和哈特莱的 工作开始的。 1924年奈奎斯特(H.Nyquist)的 “影响电报速率因素的 确定” 一文,1928年哈特莱(R.V.Hartley) 的“信息 传输” 一文研究了通信系统传输信息的能力,并给出了信 息度量的方法
1946年柯切尔尼柯夫 的学位论文“起伏噪声下的潜在 抗干扰理论”,根据最小错误概率准则和最小均方误差 准则研究了离散和连续信道的最佳接收问题 1948年香农的权威性长文“通信的数学理论”,讨论 了信源和信道特性,1949年香农“噪声中的通信”, 上述两篇文章奠定了现代信息论的理论基础 此后,在基本理论和实际应用方面,信息论都得到了巨 大的发展
二、现状 在香农理论基础上给出的最佳噪声通信系统模型近年来 正在成为现实; 在噪声中信号过滤与检测基础上发展起来的信号检测理 论和抗干扰编码基础上发展起来的编码理论已成为现代 信息论的两个重要分支; 此外,模糊信息处理、相对信息处理、主观信息处理、 智能信息处理、自动化信息控制等大量崭新课题的研究 也相继展开,使信息理论的面貌一新,并将大大促进信 息科学的发展。