0/40 符号( symbol )编码 1 字符编码 2 汉字编码 3 其他编码
1/40 一、字符编码- ASCII 码 American Standard Code Information Interchange ,美国标准信息交换码; 由美国国家标准化协会 ANSI( American National Standards Institute ) 制定 ; 被国际标准化组织 ISO ( International Organization for Standardization) 指定 为标准信息交换码。
2/40 基本 ASCII 码 7 位 ASCII 码, 7 位二进制字符编码; 表示 128 种字符编码,包括 34 种控制字符, 52 个 英文大小写字母, 10 个数字, 32 个字符和运算符; 最高位为 0 ,范围为 B ~ B
3/40 例如: “1” 的 ASCII 码为 ,即 49 , “a” 的 ASCII 码为 ,即 97 。
4/40 扩充 ASCII 码 8 位 ASCII 码, 8 位二进制字符编码; 表示 256 种不同的字符; 其中 B ~ B 为基本部分,与基本 ASCII 码相同,范围为 0 ~ 127 ,有 128 种字符; B ~ B 为扩充部分,范围为 128 ~255 ,有 128 种字符; 美国国家标准信息协会给出了编码定义,但该部 分编码被大多数非英语国家规定为自己国家语言 的字符代码。
5/40
6/40 二、汉字编码 汉字系统的编码转换过程 显示汉字打印汉字 字形码 内码 交换码(国标码) 各种输入码
7/40 汉字输入码 汉字输入码是用来完成汉字的输入的汉字编码, 也称为汉字的外码。汉字的输入编码汉字与英文 不同,因此为了能直接使用英文标准键盘把汉字 输入到计算机,就必须为汉字设计相应的输入编 码方法。当前采用的方法主要有以下三类: 数字编码(如电报码,区位码,国标码等) 音码(如全拼码,简拼码,双拼码等) 形码(如五笔字型,大众码,仓吉码等)
8/40 汉字交换码 1980 年国家标准总局颁布了 GB 《信 息交换用汉字编码字符集 · 基本集》,称为国 标交换码(简称国标码); 收录了 6763 个汉字和中文标点符号; 采用两字节 ASCII 码对应一个编码,所有汉 字字符共分为 95 个区( 0 ~94 区),每个区分 为 95 个位( 0 ~94 位),汉字所在的区号( 8 位二进制表示)和位号( 8 位二进制表示)共 同组成该字的编码; 首位为 0 ,与 ASCII 码完全兼容。
9/40 [ 南 ] 十进制: 6879 二进制: 十六进制: 444F [ 京 ] 十进制: 6241 二进制: 十六进制: 3E29 例如: “ 南 ”“ 京 ” 两个字的国标码如下所示: 区码 位码 对于 “ 南 ” 字,他的编码是: 68 , 79 ,如果我们在计算 机种存储该编码,那么,计算机也可以认为存储的是两个 英文字符。
10/40 汉字机内码 汉字内码是用于汉字信息的存储、交换、检索等操作的 机内代码,一般采用两个字节表示。为了与英文字符 能相互区别,汉字机内代码中两个字节的最高位均规 定为 “ 1 ” 。 使用两个字节保存汉字,前一字节保存高位内码,后 一字节保存低位内码; 汉字机内码并不统一,主要包括: GB2312 、 Big5 等 GB2312 机内码和交换码有如下的对应关系: 高位内码= 80H+ 高位交换码= 128D+ 高位交换码 低位内码= 80H+ 低位交换码= 128D+ 低位交换码 首位为 1 。
11/40 [ 南 ] 十进制: ,79+128= 二进制: , = [ 京 ] 十进制: , =190,169 二进制: , = , 例如: “ 南 ”“ 京 ” 两个字的机内码如下所示:
12/40 由于汉字的机内码比较长, 8 位区码加 8 位位码共 16 位,而且必须紧紧相连在一起才能表示汉字, 因此在计算机内要用相连的两个字节(高位字节 和低位字节)表示一个完整的汉字 。
13/40 汉字字形码 字形码是指字形的点阵信息的数字代码。存放 在汉字库中; 分为显示字形码和打印字形码两种。根据输出 的去向将汉字输出在显示器上或打印机上; 汉字字形码并无统一的规范。
14/40 u 字形码是用点阵表示的汉字字形代码,它是 汉字的输出形式。根据汉字输出的要求不同, 点阵的多少也不同。 u 简易汉字为 16×16 点阵,提高型汉字为 24×24 点阵、 32×32 点阵,甚至更高。因此 字模点阵的信息量是很大的,所占存储空间 也很大。以 16×16 点阵为例,每个汉字要占 用 32 个字节,国标两级汉字要占用 256K 字 节。因此字模点阵只能用来构成汉字库,而 不能用于机内存储。字库中存储了每个汉字 的点阵代码。当显示输出或打印输出时才检 索字库,输出字模点阵,得到字形。
15/40 例如: “ 霸 ” 的一种字形码: 64×64 点阵 共 4096 个点
16/40 显示汉字打印汉字 字形码 内码 交换码(国标码) 各种输入码 汉字系统的编码转换过程 汉字编码
17/40 每一种汉字编码都是计算机汉字系统必须的吗?
18/40 各种输入码 交换码(国标码) 内码 字形码 显示汉字打印汉字 如果没有汉字输入码,我们仍然可以输入汉字。遗憾的 是,当我们输入 “ 南京 ” 的时候,我们再也不能输入 “nanjing” ,而是要输入 68 , 79 ; 62 , 41 这四个枯涩难记的数字。
19/40 各种输入码 交换码(国标码) 内码 字形码 显示汉字打印汉字 如果没有汉字交换码,输入码可以直接转换为汉字内码 。遗憾的是,汉字内码并不统一,这就要求输入码系统提供 到各种不同汉字内码的转换功能。
20/40 各种输入码 交换码(国标码) 内码 字形码 显示汉字打印汉字 如果没有汉字内码,输入码可以取代内码成为汉字的存 储编码。同样遗憾的是,各种汉字内码已经在相当长的时间 存在,没有一种编码规则能很短时间内取代其他编码。
21/40 不能假设没有汉字字形码。因为如果没有汉字字形码, 我们把汉字输入计算机存储后,我们看不到任何输出,那么 ,我们输入汉字又有什么意义呢? 各种输入码 交换码(国标码) 内码 字形码 显示汉字打印汉字
22/40 三、其它信息编码 BCD 码 ISO/IEC 为了统一世界文字编码,国际标准化组织公布了 “ 通 用多八位编码字符集 ” 的国际标准 ISO/IEC 10646, 简 称 UCS (Universal Code Set) 用四个字节来表示每一个字符,全球文字统一编码。 Unicode APPLE 公司为彻底解决计算机处理多文种文本而发 起制定的通用多文种字符集。对汉字集的处理与 ISO 相似。
23/40 汉字输入码优缺点比较 (1) 数字编码 常用的是国标区位码,用数字串代表一个汉 字输入,区位码是将国家标准局公布的 6763 个两级汉字分为 94 个区,每个区分 94 位,实 际上是把汉字表示成二维数组,每个汉字在 数组中的下标就是区位码。区码和位码各两 位十进制数字,因此输入一个汉字需按键 4 次。例如 “ 中 ” 字位于第 54 区 48 位,区位码为 5448 。 数字编码输入的优点是无重码,且输入码与 内部编码的转换比较方便,缺点是代码难以 记忆
24/40 ( 2 ) 拼音码 拼音码是以汉语拼音为基础的输入方法,凡 掌握汉语拼音的人,不需训练和记忆,即可 使用。但汉字同音字太多,输入重码率很高, 因此按拼音输入后还必须进行同音字选择, 影响了输入速度。
25/40 ( 3 ) 字型编码 – 字型编码是用汉字的形状来进行编码。汉字 总数虽多,但是由一笔一划组成,全部汉字 的部件和笔画是有限的。因此,把汉字的笔 画部件用字母或数字进行编码,按笔画的顺 序依次输入,就能表示一个汉字。 – 例如五笔字型编码是最有影响的一种字型编 码方法。除了上述三种编码方法外,为了加 快输入速度,在上述方法基础上,发展了词 组输入、联想输入等多种快速输入方法。但 是都利用了键盘进行 “ 手动 ” 输入。
26/40 理想的输入方式是利用语音或图像识别 技术 “ 自动 ” 将拼音或文本输入到计算机内, 使计算机能认识汉字,听懂汉语,并将其转 换为机内代码表示。目前这种理想已经成为 现实 。
27/40 声音 声音是传递信息的重要媒体,是多媒 体技术研究中的一个重要内容 1 、声音的物理特性 机械振动或气流等外力引起周围弹性媒质 发生波动,产生声波。声波传到人耳经过人 类听觉系统的感知就是声音 声音是通过空气传播的一种连续的波,称为 声波( sound wave ) 声波到达人耳鼓膜时,人会感到压力的变化, 这就是声音( sound )
28/40 1) 幅度(振幅):指声波波形的最高 (低)点与时间轴之间的距离,反映 声音信号的大小、强弱程度 2) 频率:信号在单位时间内变化的次数, HZ; 多个频率声音的复合
29/40 人们对声音的感知不仅与声音幅度有关,还 与声音的频率有关: 可听声( audio ): 20HZ ~ 20kHZ 次音、亚音信号 (subsonic) : <20HZ 超音信号、超声 (supersonic) :>20kHZ 300HZ ~ 3kHZ 语音信号( speech )
30/40 模拟信号与数字信号 – 模拟信号:时间或幅度上连续的信号 时间上 “ 连续 ” 是指在一个指定的时间范围内声音信号的 幅值有无穷多个; 幅度上 “ 连续 ” 是指幅度的数值有无穷多个; – 数字信号:幅值被限制在有限个数值之内, 即幅值只能取有限的几个数值
31/40
32/40 习题 1. 多媒体技术中媒体信息有哪六种表现 方式? 2. 比较图形与图像,视频与动画的区别? 3. 当前采用的汉字输入编码有哪几类? 比较各自优缺点? 4. 人耳能感知的声音频率范围是多少?