0/40 符号( symbol )编码  1 字符编码  2 汉字编码  3 其他编码. 1/40 一、字符编码- ASCII 码 American Standard Code Information Interchange ,美国标准信息交换码; 由美国国家标准化协会 ANSI( American.

Slides:



Advertisements
Similar presentations
第二章 计算机基础 普通高等教育 “ 十一五 ” 国家级规划教材 全 国 高 等 医 药 院 校 药 学 类 规 划 教 材 大学计算机基础.
Advertisements

计算机概论 计算机概论 计算机的发展与展望 计算机的特点及应用 信息的表示及存储 计算机系统概述 计算机与信息社会 计算机安全 综合应用.
第三章 数据在计算机中的表示 进位计数制及相互转换 进位计数制及相互转换 3.2 数据在计算机中的表示 数据在计算机中的表示.
教学进度 计算机科学与工程系 大学计算机基础 (省精品课程) 计算机信息基础 (第二章) 华南农业大学 信息学院.
1 、什么是信息?下列哪些是信息? 书本、电铃声、知识、软件、光盘、新闻、广告 复习回顾 2 、信息具有哪些特征? 3 、数制转换 : 118D=B=H.
数制 (1) 基数:在一种数制中,只能使用一组固定的数字符号 来表示数目的大小,其使用数字符号的个数,就称为该数 制的基数。其规则是 “ 逢 b 进一 ” ,则称为 b 进制的基数。 十进制( Decimal )的基数是 10 ,,它有 10 个数字符号, 即 0 , 1 , 2 , 3 , 4 ,
1 1.2 信息的表示与存储  数据:数据是对客观事物的符号表示。 如,数值、文字、语言、图形、图像等都是不同形 式的数据。  信息:信息是既是对客观事物变化和特征的反映,又 是事物之间相互作用、相互联系的表征。 信息必须数字化编码,才能用计算机进行传送、存 储和处理。 信息具有针对性和时效性。
大学计算机基础 —— 系统工具与环境(文科用) 赵 欢 肖德贵 杨小林 陈 娟 吴蓉晖 编著. 第一部分 计算科学概论 第 2 章 计算机组成与工作原 理 大学计算机基础 —— 系统工具与环境(文科用)
第二章 汉字录入方法介绍  2.1 汉字录入简介 汉字录入的现状  在 20 世纪 70 年代中期我国开始系统地研究和开发汉字信息处理技 术。 80 年代初期产生了 CCDDS 系统,得到了广泛的应用。  在汉字操作系统发展的同时产生了五百余种的汉字输入方法设计 方案,其中几十种有实用价值的方案得到推广,现在已经成为汉.
计算机基础 张莉莉老师的联系方式: tel: qq: 学习资源: 求索课堂:操作系统
大学计算机基础.
大学计算机基础 二、信息的表示与存储.
主要内容及要求 一、计算机基础知识之一 二、计算机基础知识之二 计算机的产生和发展 计算机系统的组成 及工作原理 掌握几种进制数之间的转换
计算机发展早期主要用于科学计算,现在计算机在日常生活的应用主要是处理非数值信息,那计算机如何表示以及处理非数值信息的?
5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用
作业 试用C语言编程,实现对1024字节大小的环形缓冲区进行读写管理,要求: (1)定义对缓冲区访问所需数据结构;
1、 信息:通常理解为用各种媒体(语言、文字、图形、符号、声音和影像等)对事物存在形式、运动状态和相互联系特征的表达和描述。
微型计算机中数的编码和字符的表示 1 数的表示与转换方法 2 带符号数的表示方法 3 定点数与浮点数 4 计算机中的编码.
第1章 计算机基础知识 1.4 二进制数的运算及其加法电路 1.4.1二进制数据算术运算规则 (1) 加法运算规则
计算机基础 第2讲 授课教师:徐鲁辉.
文字及其处理技术.
第1章 信息时代与计算机 信息与信息技术 计算机概述 计算机系统工作原理和组成 计算机中信息的表示
内容提要: 汉字与计算机键盘匹配存在的问题 汉字键盘输入发展简史 汉字编码输入方案 汉字输入法的软件实现 汉字编码的类型
1.5 数制与编码 任务1:了解二进制数和十进制数之间的转换 任务2:认识ASCII码和汉字编码 汉字编码 ASCII码 计算机基础知识
第四章 数制和信息编码 4.1 引言 4.2 数制与运算 4.3 数据存储单位和内存地址 4.4 信息编码.
正则表达式一点通:正则中的中文.
计算机应用基础教程 主讲:闵乐 QQ: TEL:
第一章 计算机系统结构.
21世纪高职高专规划教材 计算机文化基础教程 谢惠 向隅 主编 中国水利水电出版社.
第1章 计算机基础知识 (第2节).
C++中的声音处理 在传统Turbo C环境中,如果想用C语言控制电脑发声,可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为: Beep(频率,持续时间) , 单位毫秒 暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒 引用这两个函数时,必须包含头文件
第二章 计算机基础知识 2.1 计算机系统的组成与工作原理 2.2 数制转换及运算 2.3 数据在计算机中的表示.
计算机基础知识 丁家营镇九年制学校 徐中先.
第 1 章 概 论.
A3-1 數字系統 A3-2 資料表示法 A3-3 資料的儲存
圖學I 第一章 緒論 1-1 工程圖學之意義 1-2 工程圖之種類 1-3 圖紙規格及其折摺法 1-4 工程圖之比例大小
大学计算机基础——周口师范学院 第1章 计算机基础知识 1.2 数据编码.
第2章 计算机的基础知识.
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
§7.4 波的产生 1.机械波(Mechanical wave): 机械振动在介质中传播过程叫机械波。1 2 举例:水波;声波.
多媒体技术 中南大学信息科学与工程学院 黄东军.
本节内容 字符编码 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
计算机文化概论
C语言程序设计 主讲教师:陆幼利.
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
第1章 数制与编码.
<编程达人入门课程> 本节内容 内存的使用 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群: ,
组合逻辑电路 ——中规模组合逻辑集成电路.
实验三 16位算术逻辑运算实验 不带进位控制的算术运算 置AR=1: 设置开关CN 1 不带进位 0 带进位运算;
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
2017第二轮选考复习 多媒体信息编码.
《手把手教你学STM32-STemWin》 主讲人 :正点原子团队 硬件平台:正点原子STM32开发板 版权所有:广州市星翼电子科技有限公司
本节内容 结构体 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
C++语言程序设计 C++语言程序设计 第二章 基本数据类型与表达式 第十一组 C++语言程序设计.
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
   本课件为教师罗英伟参加信息学院青年教师教学基本功比赛时所作,当时获得信息学院一等奖。其内容为北京大学本科生主干必修课“计算概论”中的一节。
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
实验目的:掌握数据的顺序存储结构及它们在计算机中的操作。 实验内容:
多媒体技术 中南大学信息科学与工程学院 黄东军.
图片与视频数字化. 图片与视频数字化 图片分类 根据图片的构成元素来分 位图: 由像素组成,计算机按顺序存储每个像素点 的颜色信息的保存方式获得的图片。 位图放大后会模糊失真,存储空间相对较大。 矢量图: 由图元组成,通过数学公式计算获得的图片。 放大后不会失真,占用空间小。
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
多媒体信息编码.
数据表示 第 2 讲.
微机原理与接口技术 西安邮电大学计算机学院 董 梁.
FVX1100介绍 法视特(上海)图像科技有限公司 施 俊.
复习:十进制与其他进制的转换 十进制转换为二进制: 短除法:除以2倒取余数 十进制转换为十六进制: 短除法:除以16倒取余数
§4.5 最大公因式的矩阵求法( Ⅱ ).
<编程达人入门课程> 本节内容 有符号数与无符号数 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ:
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

0/40 符号( symbol )编码  1 字符编码  2 汉字编码  3 其他编码

1/40 一、字符编码- ASCII 码 American Standard Code Information Interchange ,美国标准信息交换码; 由美国国家标准化协会 ANSI( American National Standards Institute ) 制定 ; 被国际标准化组织 ISO ( International Organization for Standardization) 指定 为标准信息交换码。

2/40 基本 ASCII 码  7 位 ASCII 码, 7 位二进制字符编码;  表示 128 种字符编码,包括 34 种控制字符, 52 个 英文大小写字母, 10 个数字, 32 个字符和运算符;  最高位为 0 ,范围为 B ~ B

3/40 例如: “1” 的 ASCII 码为 ,即 49 , “a” 的 ASCII 码为 ,即 97 。

4/40 扩充 ASCII 码 8 位 ASCII 码, 8 位二进制字符编码;  表示 256 种不同的字符;  其中 B ~ B 为基本部分,与基本 ASCII 码相同,范围为 0 ~ 127 ,有 128 种字符;  B ~ B 为扩充部分,范围为 128 ~255 ,有 128 种字符;  美国国家标准信息协会给出了编码定义,但该部 分编码被大多数非英语国家规定为自己国家语言 的字符代码。

5/40

6/40 二、汉字编码 汉字系统的编码转换过程 显示汉字打印汉字 字形码 内码 交换码(国标码) 各种输入码

7/40 汉字输入码 汉字输入码是用来完成汉字的输入的汉字编码, 也称为汉字的外码。汉字的输入编码汉字与英文 不同,因此为了能直接使用英文标准键盘把汉字 输入到计算机,就必须为汉字设计相应的输入编 码方法。当前采用的方法主要有以下三类:  数字编码(如电报码,区位码,国标码等)  音码(如全拼码,简拼码,双拼码等)  形码(如五笔字型,大众码,仓吉码等)

8/40 汉字交换码 1980 年国家标准总局颁布了 GB 《信 息交换用汉字编码字符集 · 基本集》,称为国 标交换码(简称国标码);  收录了 6763 个汉字和中文标点符号;  采用两字节 ASCII 码对应一个编码,所有汉 字字符共分为 95 个区( 0 ~94 区),每个区分 为 95 个位( 0 ~94 位),汉字所在的区号( 8 位二进制表示)和位号( 8 位二进制表示)共 同组成该字的编码;  首位为 0 ,与 ASCII 码完全兼容。

9/40 [ 南 ] 十进制: 6879 二进制: 十六进制: 444F [ 京 ] 十进制: 6241 二进制: 十六进制: 3E29 例如: “ 南 ”“ 京 ” 两个字的国标码如下所示: 区码 位码 对于 “ 南 ” 字,他的编码是: 68 , 79 ,如果我们在计算 机种存储该编码,那么,计算机也可以认为存储的是两个 英文字符。

10/40 汉字机内码 汉字内码是用于汉字信息的存储、交换、检索等操作的 机内代码,一般采用两个字节表示。为了与英文字符 能相互区别,汉字机内代码中两个字节的最高位均规 定为 “ 1 ” 。  使用两个字节保存汉字,前一字节保存高位内码,后 一字节保存低位内码;  汉字机内码并不统一,主要包括: GB2312 、 Big5 等  GB2312 机内码和交换码有如下的对应关系: 高位内码= 80H+ 高位交换码= 128D+ 高位交换码 低位内码= 80H+ 低位交换码= 128D+ 低位交换码  首位为 1 。

11/40 [ 南 ] 十进制: ,79+128= 二进制: , = [ 京 ] 十进制: , =190,169 二进制: , = , 例如: “ 南 ”“ 京 ” 两个字的机内码如下所示:

12/40 由于汉字的机内码比较长, 8 位区码加 8 位位码共 16 位,而且必须紧紧相连在一起才能表示汉字, 因此在计算机内要用相连的两个字节(高位字节 和低位字节)表示一个完整的汉字 。

13/40 汉字字形码  字形码是指字形的点阵信息的数字代码。存放 在汉字库中;  分为显示字形码和打印字形码两种。根据输出 的去向将汉字输出在显示器上或打印机上;  汉字字形码并无统一的规范。

14/40 u 字形码是用点阵表示的汉字字形代码,它是 汉字的输出形式。根据汉字输出的要求不同, 点阵的多少也不同。 u 简易汉字为 16×16 点阵,提高型汉字为 24×24 点阵、 32×32 点阵,甚至更高。因此 字模点阵的信息量是很大的,所占存储空间 也很大。以 16×16 点阵为例,每个汉字要占 用 32 个字节,国标两级汉字要占用 256K 字 节。因此字模点阵只能用来构成汉字库,而 不能用于机内存储。字库中存储了每个汉字 的点阵代码。当显示输出或打印输出时才检 索字库,输出字模点阵,得到字形。

15/40 例如: “ 霸 ” 的一种字形码: 64×64 点阵 共 4096 个点

16/40 显示汉字打印汉字 字形码 内码 交换码(国标码) 各种输入码 汉字系统的编码转换过程 汉字编码

17/40 每一种汉字编码都是计算机汉字系统必须的吗?

18/40 各种输入码 交换码(国标码) 内码 字形码 显示汉字打印汉字 如果没有汉字输入码,我们仍然可以输入汉字。遗憾的 是,当我们输入 “ 南京 ” 的时候,我们再也不能输入 “nanjing” ,而是要输入 68 , 79 ; 62 , 41 这四个枯涩难记的数字。

19/40 各种输入码 交换码(国标码) 内码 字形码 显示汉字打印汉字 如果没有汉字交换码,输入码可以直接转换为汉字内码 。遗憾的是,汉字内码并不统一,这就要求输入码系统提供 到各种不同汉字内码的转换功能。

20/40 各种输入码 交换码(国标码) 内码 字形码 显示汉字打印汉字 如果没有汉字内码,输入码可以取代内码成为汉字的存 储编码。同样遗憾的是,各种汉字内码已经在相当长的时间 存在,没有一种编码规则能很短时间内取代其他编码。

21/40 不能假设没有汉字字形码。因为如果没有汉字字形码, 我们把汉字输入计算机存储后,我们看不到任何输出,那么 ,我们输入汉字又有什么意义呢? 各种输入码 交换码(国标码) 内码 字形码 显示汉字打印汉字

22/40 三、其它信息编码 BCD 码 ISO/IEC  为了统一世界文字编码,国际标准化组织公布了 “ 通 用多八位编码字符集 ” 的国际标准 ISO/IEC 10646, 简 称 UCS (Universal Code Set)  用四个字节来表示每一个字符,全球文字统一编码。 Unicode  APPLE 公司为彻底解决计算机处理多文种文本而发 起制定的通用多文种字符集。对汉字集的处理与 ISO 相似。

23/40 汉字输入码优缺点比较 (1) 数字编码  常用的是国标区位码,用数字串代表一个汉 字输入,区位码是将国家标准局公布的 6763 个两级汉字分为 94 个区,每个区分 94 位,实 际上是把汉字表示成二维数组,每个汉字在 数组中的下标就是区位码。区码和位码各两 位十进制数字,因此输入一个汉字需按键 4 次。例如 “ 中 ” 字位于第 54 区 48 位,区位码为 5448 。  数字编码输入的优点是无重码,且输入码与 内部编码的转换比较方便,缺点是代码难以 记忆

24/40 ( 2 ) 拼音码 拼音码是以汉语拼音为基础的输入方法,凡 掌握汉语拼音的人,不需训练和记忆,即可 使用。但汉字同音字太多,输入重码率很高, 因此按拼音输入后还必须进行同音字选择, 影响了输入速度。

25/40 ( 3 ) 字型编码 – 字型编码是用汉字的形状来进行编码。汉字 总数虽多,但是由一笔一划组成,全部汉字 的部件和笔画是有限的。因此,把汉字的笔 画部件用字母或数字进行编码,按笔画的顺 序依次输入,就能表示一个汉字。 – 例如五笔字型编码是最有影响的一种字型编 码方法。除了上述三种编码方法外,为了加 快输入速度,在上述方法基础上,发展了词 组输入、联想输入等多种快速输入方法。但 是都利用了键盘进行 “ 手动 ” 输入。

26/40 理想的输入方式是利用语音或图像识别 技术 “ 自动 ” 将拼音或文本输入到计算机内, 使计算机能认识汉字,听懂汉语,并将其转 换为机内代码表示。目前这种理想已经成为 现实 。

27/40 声音 声音是传递信息的重要媒体,是多媒 体技术研究中的一个重要内容 1 、声音的物理特性 机械振动或气流等外力引起周围弹性媒质 发生波动,产生声波。声波传到人耳经过人 类听觉系统的感知就是声音 声音是通过空气传播的一种连续的波,称为 声波( sound wave ) 声波到达人耳鼓膜时,人会感到压力的变化, 这就是声音( sound )

28/40 1) 幅度(振幅):指声波波形的最高 (低)点与时间轴之间的距离,反映 声音信号的大小、强弱程度 2) 频率:信号在单位时间内变化的次数, HZ; 多个频率声音的复合

29/40 人们对声音的感知不仅与声音幅度有关,还 与声音的频率有关: 可听声( audio ): 20HZ ~ 20kHZ 次音、亚音信号 (subsonic) : <20HZ 超音信号、超声 (supersonic) :>20kHZ 300HZ ~ 3kHZ 语音信号( speech )

30/40 模拟信号与数字信号 – 模拟信号:时间或幅度上连续的信号 时间上 “ 连续 ” 是指在一个指定的时间范围内声音信号的 幅值有无穷多个; 幅度上 “ 连续 ” 是指幅度的数值有无穷多个; – 数字信号:幅值被限制在有限个数值之内, 即幅值只能取有限的几个数值

31/40

32/40 习题 1. 多媒体技术中媒体信息有哪六种表现 方式? 2. 比较图形与图像,视频与动画的区别? 3. 当前采用的汉字输入编码有哪几类? 比较各自优缺点? 4. 人耳能感知的声音频率范围是多少?