第 1 章 概 论
主 要 内 容 1.1 计算机的发展 1.2 计算机的特点、应用及分类 1.3 计算机中的数制与编码
1.1 计算机的发展 1.1.1 电子计算机的诞生 1.1.2 电子计算机的发展历程 1.1.3 计算机发展趋势 1.1.4 未来计算机
1.1.1 电子计算机的诞生 电子计算机的问世 1946年2月由宾州大学研制成功的ENIAC 电子计算机时代的到来 电子数字积分计算机 1.1.1 电子计算机的诞生 电子计算机的问世 1946年2月由宾州大学研制成功的ENIAC 电子计算机时代的到来 重达30吨 占地250m2 启动工耗150000瓦 18000个电子管 保存80个字节 电子数字积分计算机 Electronic Numerical Integrator And Calculator
1.1.1 电子计算机的诞生 第一台数字电子计算机 ENIAC(埃尼阿克):1946年诞生在美国宾夕法尼亚大学,元器件为:18000支电子管、70000个电阻、10000支电容,性能为重30吨,耗电150千瓦,速度5000次加减运算/秒;用途:火炮弹道计算。该计算机不具备“存储程序”的功能。 冯.诺依曼结构: 采用二进制表示数据或指令 计算机的硬件由运算器、控制器、存储器、输入设备和输出设备组成 指令存储在计算机内且能自动执行
1.1.2 电子计算机的发展历程 第一代 电子管,磁鼓、磁芯,几千~几万次,数据处理、科学计算,机器语言和汇编语言 1.1.2 电子计算机的发展历程 第一代 电子管,磁鼓、磁芯,几千~几万次,数据处理、科学计算,机器语言和汇编语言 第二代 晶体管,磁芯、磁盘,几十万~几百万次,科学计算、数据处 理、工业控制,高级语言FORTRAN、COBOL、ALGOL60等 第三代 中、小规模集成电路,半导体存储器,几百万~千万次,应用在各个领域,在硬件设计上实现了系列化、通用化和标准化,软件形成了操作系统、编译系统和应用程序 第四代 大规模和超大规模集成电路,半导体存储器,几万亿~十万亿次,出现了微型计算机,应用到各行各业,正向多媒体计算机和计算机网络发展
1.1.2 电子计算机的发展历程 时代 年份 器件 软件 应用 一 46-58 电子管 机器语言汇编语言 科学计算 二 58-64 晶体管 1.1.2 电子计算机的发展历程 时代 年份 器件 软件 应用 一 46-58 电子管 机器语言汇编语言 科学计算 二 58-64 晶体管 高级语言 数据处理工业控制 三 64-71 集成电路 操作系统 文字处理图形处理 四 71年迄今 大规模集成电路 数据库、网络等 社会的各个领域
1.1.3 计算机发展趋势 ★巨型化: 存储容量为几百MB、运算速度为数万亿次/秒 ★微型化: 操作简便、使用方便、物美价廉的微型计算机 1.1.3 计算机发展趋势 ★巨型化: 存储容量为几百MB、运算速度为数万亿次/秒 ★微型化: 操作简便、使用方便、物美价廉的微型计算机 ★ 网络化: 用通信技术和计算机技术把分散的计算机互联在一起,达到软硬件资源和数据资源共享的目的。目前开发的三网合一是指电信网、计算机网和有线电视网合为一体 ★ 多媒体化:现代计算机可以集图形、图像、声音、文字处理为一体,多媒体技术使信息处理的对象和内容发生了深刻变化。 ★智能化: 能模拟人的思维和感官,具有识别声音、图像的能力,有推理、联想学习的功能
1.1.4 未来计算机 ★神经网络计算机:用数据处理单元模拟人脑的脑细胞胞(神经元) 1.1.4 未来计算机 ★神经网络计算机:用数据处理单元模拟人脑的脑细胞胞(神经元) ★生物计算机:使用由蛋白分子为主要原料的生物芯片,具有巨大的存储能力,且以波的形式传输信息。由于蛋白分子具有自我组合的特性,故使生物计算机有自我调节能力、自修复能力和自再生能力。 ★光子计算机:利用光子代替电子,以光互连代替导线互连,即以光硬件代替电子硬件,光运算代替电运算,从而使运算速度大大提高。
1.2 计算机的特点、应用及分类 1.2.1 计算机的特点 1.2.2 计算机的应用 1.2.3 计算机的分类
1.2.1 计算机的特点 运算速度快 计算精度高 具有记忆和逻辑判断功能 高度自动化又支持人机交互 通用性强
1.2.2 计算机的应用 科学计算(数值计算):是计算机应用最早也是最基本的应用领域。 1.2.2 计算机的应用 科学计算(数值计算):是计算机应用最早也是最基本的应用领域。 信息管理(数据处理):信息管理是目前计算机应用最广泛的领域之一。 电子商务:电子商务是Internet爆炸式发展的直接产物,是网络技术应用的全新发展方向。 过程控制(实时控制):要求快的响应速度。 计算机辅助系统:帮助人们实现最佳设计或和处理 CAD --- 计算机辅助设计 CAM --- 计算机辅助制造 CAI --- 计算机辅助教学 CBE --- 计算机辅助教育 CAT --- 计算机辅助测试 现代教育:计算机作为现代教学手段在教育领域中应用得越来越广泛、深入。 人工智能(智能模拟):机器人,专家系统,模式识别 网络应用
1.2.3 计算机的分类 1.按性能分类 这是最常规的分类方法,所依据的性能主要包括:存储容量;运算速度;允许同时使用一台计算机的用户多少和价格等。 巨型计算机(Supercomputer):功能最强、速度最快、价格最贵的计算机。 大型计算机(Mainframe Computer):有很高的运算速度和很大的存储量,并允许相当多的用户同时使用。 小型计算机(Minicomputer):规模比大型机要小,但仍能支持十几个用户同时使用。 微型计算机(Microcomputer):特点是小巧、灵活、便宜,在同一时刻只能供一个用户使用,也叫个人计算机(Personal Computer)。 工作站(Workstation):与功能较强的高档微型机之间的差别不十分明显。它通常比微型机有较大的存储容量和较快的运算速度,而且配备大屏幕显示器。工作站主要用于图像处理和计算机辅助设计等领域。
1.2.3 计算机的分类 2.按处理的数据分类 按处理数据的类型分类,可以分为数字计算机、模拟计算机和混合计算机。 1.2.3 计算机的分类 2.按处理的数据分类 按处理数据的类型分类,可以分为数字计算机、模拟计算机和混合计算机。 数字计算机:数字计算机所处理的数据(以电信号表示)是离散的,称为数字量。目前,常用的计算机大都是数字计算机。 模拟计算机:模拟计算机所处理的数据是连续的,称为模拟量。模拟计算机不如数字计算机精确,模拟计算机常以绘图或量表的形式输出。 混合计算机:集数字计算机与模拟计算机的优点于一身,可以接受模拟量或数字量的运算,最后以连续的模拟量或离散的数字量为输出结果。
1.2.3 计算机的分类 3.按使用范围分类 按使用范围分类,可以分为通用计算机和专用计算机。 1.2.3 计算机的分类 3.按使用范围分类 按使用范围分类,可以分为通用计算机和专用计算机。 通用计算机:通用计算机适用于一般科学运算、学术研究、工程设计和数据处理等广泛用途的计算。通常所说的计算机均指通用计算机。 专用计算机:专用计算机是为适应某种特殊应用而设计的计算机,它的运行程序不变、效率较高、速度较快、精度较好,但只能作为专用。
计算机的分类 (IEEE——美国电气和电子工程师学会) 计算机分为 主机:即大型计算机 小型机:结构简单、价格较低,使用方便 个人计算机:包括台式计算机、笔记本计算机、掌上电脑(PDA) 小巨型机:即小型化的巨型机 巨型机:即超级计算机。价格昂贵、运算速度快,存储容量大。 工作站:专门处理特殊事务的一种独立的计算机
1.3 计算机中的数制与编码 1.3.1 计算机的数制 1.3.2 各类数制间的转换 1.3.3 数值数据的编码 1.3.4 字符的编码 1.3 计算机中的数制与编码 1.3.1 计算机的数制 1.3.2 各类数制间的转换 1.3.3 数值数据的编码 1.3.4 字符的编码 1.3.5 汉字的编码
1.3.1 计算机的数制 1.数制的基本概念 数的表示规则称为数制,其中按照进位方式记数的数制叫进位记数制。 (1)十进制计数制 1.3.1 计算机的数制 1.数制的基本概念 数的表示规则称为数制,其中按照进位方式记数的数制叫进位记数制。 (1)十进制计数制 从最常用和最熟悉的十进制计数法可以看出,其加法规则是“逢十进一”。任意一个十进制数值都可用0、1、2、3、4、5、6、7、8、9共10个数字符号来表示,这些数字符号称为数码;数码处于不同的位置(数位)代表不同的数值。十进制数819.18可以写成:
1.3.1 计算机的数制 1.数制的基本概念 (2)R进制计数制 1.3.1 计算机的数制 1.数制的基本概念 (2)R进制计数制 对比十进制数可以得出,任意R进制计数制同样有基数R、位权和按权展开表示式。如二进制的R为2,十六进制R为16等。 ① 基数:一个计数制所包含数字符号个数称为该数制的基数,用R表示 十进制 R=10, 可使用0,1,2,3,4,5,6,7,8,9 二进制 R=2 , 可使用0,1 八进制 R=8 , 可使用0,1,2,3,4,5,6,7 十六进制 R=16 ,可使用0,……,9,A,B,C,D,E,F ②位权:在进位记数制中数码所处的位置不同,代表的数值大小也不同 位权与基数的关系:位权的值等于基数的若干次幂 ③ 数的按位权展开:任一R进制数的值都可表示为各位数码本身的值与其所在位位权的乘积之和。 (an…a1a0 .a-1…a-m)r = an×rn+…+a0×r0+a-1×r-1+…+a-m×r-m
1.3.1 计算机的数制 2.常用的进位计数制 (1)十进制 1.3.1 计算机的数制 2.常用的进位计数制 (1)十进制 基数为10,即“逢十进一”。它含有10个数字符号:0、1、2、3、4、5、6、7、8、9。位权为10i,(i=-m~n-1,其中m、n为自然数)。 (2)二进制 基数为2,即“逢二进一”。它含有两个数字符号:0、1。位权为2i(i=-m~n-1,其中m、n为自然数)。二进制是计算机中采用的计数方式, (3)八进制 基数为8,即“逢八进一”。它含有8个数字符号:0、1,2、3、4、5、6、7。位权为8i(i=-m~n-1,其中m、n为自然数)。 (4)十六进制 基数为16,即“逢十六进一”。它含有16个数字符号:0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F,其中A、B、C、D、E,F分别表示十进制数10、11、12、13、14、15。位权为16i(i=-m~n-1,其中m、n为自然数)。
1.3.1 计算机的数制 各数制之间对应关系 应当指出,二、八、十六和十进制都是计算机中常用的数制,所以在一定数值范围内直接写出它们之间的对应表示,也是经常遇到的。右表列出了0~15这16个十进制数与其他3种数制的对应关系。 十进制 二进制 八进制 十六进制 0 0000 000 0 1 0001 001 1 2 0010 002 2 3 0011 003 3 4 0100 004 4 5 0101 005 5 6 0110 006 6 7 0111 007 7 8 1000 010 8 9 1001 011 9 10 1010 012 A 11 1011 013 B 12 1100 014 C 13 1101 015 D 14 1110 016 E 15 1111 017 F 16 10000 020 10 上一页 下一页
(an…a1a0 .a-1…a-m)r = an×rn+…+a0×r0+a-1×r-1+…+a-m×r-m 1.3.2 各类数制间的转换 1.任意r进制数转换成十进制数 利用按位权展开的方法,可以把任意数制的一个数转换成十进制数。(r是任意进制数的基数) (an…a1a0 .a-1…a-m)r = an×rn+…+a0×r0+a-1×r-1+…+a-m×r-m 101.101B= =4+0+1+0.5+0+0.125=5.625D 777O= =448+56+7=511D 0BAH= =176+10=186D
1.3.2 各类数制间的转换 2.十进制数转换成任意r进制数 (1)把十进制整数转换成任意r进制整数 1.3.2 各类数制间的转换 2.十进制数转换成任意r进制数 (1)把十进制整数转换成任意r进制整数 采用“除r取余”法。具体步骤是:把十进制整数除以r得一商数和一余数;再将所得的商除以r,又得到一个新的商数和余数;这样不断地用r去除所得的商数,直到商等于0为止。每次相除所得的余数便是对应的二进制整数的各位数码。第一次得到的余数为最低有效位,最后一次得到的余数为最高有效位。可以理解为:除r取余,自下而上。 (2)把十进制小数转换成任意r进制小数 采用“乘r取整,自上而下”法。具体步骤是:把十进制小数乘以r得一整数部分和一小数部分;再用r乘所得的小数部分,又得到一整数部分和一小数部分;这样不断地用r去乘所得的小数部分,直到所得小数部分为0或达到要求的精度为止。每次相乘后所得乘积的整数部分就是相应二进制小数的各位数字,第一次相乘所得的整数部分为最高有效位,最后一次得到的整数部分为最低有效位。
1.3.2 各类数制间的转换 2.十进制数转换成任意r进制数 例:( 9.6875 ) 10 = ( ? ) 2 1.3.2 各类数制间的转换 2.十进制数转换成任意r进制数 例:( 9.6875 ) 10 = ( ? ) 2 用除2取余法求出整数9对应的二进制 用乘2取整法求出小数部分0.6875的二进制 ( 9.6875 ) 10 =(1001.1011)2 0.6875×2=1.375 …… 取出整数1 0.375×2=0.75 …… 取出整数0 0.75×2=1.50 …… 取出整数1 0.5×2=1.00 …… 取出整数1 (0.6875)1 0 =(0.1011)2 (9) 10= (1001) 2 2 9 ---- 余数为 1 2 4 ---- 余数为 0 2 2 ---- 余数为 0 2 1 ---- 余数为 1 上一页 下一页
1.3.2 各类数制间的转换 3.二进制数与八进制或十六进制数间的转换 1.3.2 各类数制间的转换 3.二进制数与八进制或十六进制数间的转换 用二进制数编码,存在这样一个规律:n位二进制数最多能表示2n种状态。可见,3位二进制数就可对应表示一位八进制数;4位二进制数就可对应表示一位十六进制数。利用这样的规律可以进行二进制数与八进制或十六进制数间的转换 (1)八进制、十六进制转换为二进制 每位八进制可用3位二进制数表示 每位十六进制可用4位二进制数表示 (2)二进制转换为八进制、十六进制 从小数点开始分别向左、向右按每3位一组划分,不足3位的组以“0”补足,然后将每组3位二进制数转换为等值的一位八进制数。 从小数点开始分别向左、向右按每4位一组划分,不足4位的组以“0”补足,然后将每组4位二进制数转换为等值的一位十六进制数。 上一页 下一页
1.3.2 各类数制间的转换 3.二进制数与八进制或十六进制数间的转换 八进制、十六进制转换为二进制的例子: 1.3.2 各类数制间的转换 3.二进制数与八进制或十六进制数间的转换 八进制、十六进制转换为二进制的例子: (2C1D)16=( 0010 1100 0001 1101 )2 2 C 1 D (7123) 8=(111 001 010 011) 2 7 1 2 3 二进制转换为八进制、十六进制的例子: (0011 0110 1110.1101 0100)2 = ( 36E.D4 )16 3 6 E D 4 (001 101 101 110. 110 101)2 = ( 1556.65 )8 1 5 5 6 6 5 上一页 下一页
1.3.2 各类数制间的转换 4.常用数制的书写形 把数字用圆括号括起来加写下标 数字后面加写相应的英文字母作标识 1.3.2 各类数制间的转换 4.常用数制的书写形 把数字用圆括号括起来加写下标 (567)10 (1011)2 (345)8 (5AD)16 数字后面加写相应的英文字母作标识 D ---- 表示十进制 567D B ---- 表示二进制 1011B O ---- 表示八进制 345O H ---- 表示十六进制 5ADH
1.3.3 数值数据的编码 1. 机器数的概念 128瓦 32瓦 64瓦 16瓦 8瓦 4瓦 1瓦 2瓦 1 1.3.3 数值数据的编码 1. 机器数的概念 在计算机中,只有“0”和“1”两种形式,所以数的正、负号,也必须以“0”和“1”表示。通常把一个数的最高位定义为符号位,用“0”表示正,“1”表示负,称为数符,其余位表示数值。把在机器内存放的正、负号数码化的数称为机器数;把机器外部由正、负号表示的数称为真值数。例如,真值为-00101100B的机器数为10101100B,存放在机器中。 128瓦 32瓦 64瓦 16瓦 8瓦 4瓦 1瓦 2瓦 1 上一页 下一页
1.3.3 数值数据的编码 信息的存储单位 = 27+ 24+ 22+ 20 = 149 位(Bit):度量数据的最小单位 1.3.3 数值数据的编码 信息的存储单位 位(Bit):度量数据的最小单位 字节(Byte):最常用的基本单位 b7 b6 b5 b4 b3 b2 b1 b0 1 0 0 1 0 1 0 1 = 27+ 24+ 22+ 20 = 149 K 字节 1K = 1024 B M(兆)字节 1M = 1024 K G(京) 字节 1G = 1024 M T(垓)字节 1T = 1024G 上一页
1.3.3 数值数据的编码 2.数的定点和浮点表示 (1)定点小数 1.3.3 数值数据的编码 2.数的定点和浮点表示 (1)定点小数 定点小数是指小数点准确固定在数据某一个位置上的小数。一般把小数点固定在最高位的左边,小数点前边再设一位符号位。按此规则,任何一个小数都可以写成: N=NSN-1N-2……N-M 其中NS为符号位。 符号位 小数点 定点小数: -0.6875D= -0.1011000B | N |≤ 1 - 2 -M - 1 上一页 下一页
1.3.3 数值数据的编码 2.数的定点和浮点表示 (2)整数的表示法 1.3.3 数值数据的编码 2.数的定点和浮点表示 (2)整数的表示法 整数所表示的数据的最小单位为1,可以认为它是小数点定在数值最低位(最右面)的一种表示法。整数分为带符号整数和无符号整数两类。对于带符号整数,符号位放在最高位。可以表示为:N=NSNN-1NN-2……N2N1N0 ,NS为符号位 小数点 |N|≤ 2 N -1 定点整数 : 139D=11000001B(无符号位) 符号位 ± 无符号位 0≤|N|≤2N+1-1 1 N位 定点整数 : ±75D= ±1001011B(带符号位) 上一页 下一页
1.3.3 数值数据的编码 2.数的定点和浮点表示 注:尾数的位数决定数的精度,阶码的位数决定数的范围 (3)浮点数的表示方法 1.3.3 数值数据的编码 2.数的定点和浮点表示 (3)浮点数的表示方法 浮点表示法对应于科学(指数)计数法,如数110.011可表示为 N=110.011=1.10011×210=11001.1×2-10=0.110011×2+11 在计算机中一个浮点数由两部分构成:阶码和尾数。阶码是指数,尾数是纯小数。 阶符 阶码 数符 尾数 浮点数存储格式 110.011B=0.110011×2+11 存储在计算机中的浮点数 0 11 0 110011 N=数符×尾数×2 阶符×阶码 注:尾数的位数决定数的精度,阶码的位数决定数的范围 上一页 下一页
1.3.4 字符的编码 计算机中的信息都是用二进制编码表示的。用于表示字符的二进制编码称为字符编码。计算机中常用的字符编码有EBCDIC(Extended Binary Coded Decimal Interchange Code)码和ASCII(American Standard Code for Information Interchange)码。IBM系列,大型机采用EBCDIC码,微型机采用ASCII码。 1.ASCII码 ASCII码是美国标准信息交换码,被国际标准化组织指定为国际标准。ASCⅡ码有7位码和8位码两种版本。国际通用的7位ASCⅡ码是用7位二进制数表示一个字符的编码,其编码范围从0000000B~1111111B,共有27(128)个不同的编码,相应可以表示128个不同字符的编码。 空格 20H 32 0~9 30H~39H 48~57 A~Z 41H~5AH 65~90 a~z 61H~7AH 97~122 控制字符:0~32,127;普通字符:94个 每个字符占一个字节,用7位,最高位为0 上一页 下一页
( American Standard Code for Information Interchange ) ASCII码 6 5 4 3 2 1 0 ASCII码是美国信息交换标准代码 ( American Standard Code for Information Interchange ) 包括0~9十个数字,大小写英文字母及专用符号等95种可打印字符和33种控制符 COMPUTER 01000011 01001111 01001101 01010000 01010101 01010100 01000101 01010010 上一页 下一页
1.3.4 字符的编码 2.BCD码 每位十进制数用四位二进制数编码表示 25=(0010 0101)BCD 2 5 1.3.4 字符的编码 2.BCD码 BCD(Binary Coded Decimal)码是二进制编码的十进制数,有4位BCD码、6位BCD码和扩展的BCD码3种。 (1)8421BCD码 8421BCD码是用4位二进制数表示一个十进制数字,4位二进制数从左到右其位权依次为8、4、2、1,它只能表示十进制数的0~9十个字符。为了能对一个多位十进制数进行编码,需要有和十进制数的位数一样多的4位组。 每位十进制数用四位二进制数编码表示 25=(0010 0101)BCD 2 5 上一页 下一页
1.3.4 字符的编码 2.BCD码 (2)扩展BCD码 由于8421BCD码只能表示10个十进制数,所以在原来4位BCD码的基础上又产生了6位BCD码。它能表示64个字符,其中包括10个十进制数,26个英文字母和28个特殊字符。但在某些场合,还需要区分英文字母的大、小写,这就提出了扩展BCD码,它是由8位组成的,可表示256个符号,其名称为Extended Binary Coded Decimal Interchange Code,缩写为EBCDIC。 EBCDIC码是常用的编码之一,IBM及UNIVAC计算机均采用这种编码。 上一页 下一页
1.3.4 字符的编码 3.Unicode编码 扩展的ASCII码所提供的256个字符,用来表示世界各国的文字编码还显得不够,还需要表示更多的字符和意义,因此又出现了Unicode编码。 Unicode是一种16位的编码,能够表示65 000多个字符或符号。目前世界上的各种语言一般所使用的字母或符号都在3400个左右,所以Unicode编码可以用于任何一种语言。 Unicode编码与现在流行的ASCII码完全兼容,二者的前256个符号是一样的。目前,Unicode编码已经在Windows NT、OS/2、Office 2000等软件中使用。 上一页 下一页
1.3.5 汉字的编码 为了在计算机内表示汉字,用计算机处理汉字,同样也需要对汉字进行编码。计算机对汉字信息的处理过程实际上是各种汉字编码间的转换过程。这些编码主要包括:汉字输入码、汉字内码、汉字字形码、汉字地址码及汉字信息交换码等。 1.汉字信息交换码 汉字信息交换码是用于汉字信息处理系统之间或汉字信息处理系统与通信系统之间进行信息交换的汉字代码,简称交换码,也叫国标码。它是为使系统、设备之间信息交换时能够采用统一的形式而制定的。 我国1981年颁布了国家标准——信息交换用汉字编码字符集(基本集),代号为GB2312-80,即国标码。 上一页 下一页
1.3.5 汉字的编码 1.汉字信息交换码 (1)常用汉字及其分级 1.3.5 汉字的编码 1.汉字信息交换码 (1)常用汉字及其分级 国标码规定一般汉字信息处理时所用的7445个字符编码,其中682个非汉字图形符号和6763个汉字的代码。汉字代码中又有一级常用字3755个,二级次常用字3008个。一级常用汉字按汉语拼音字母顺序排列,二级次常用字按偏旁部首排列,部首依笔画多少排序。 (2)两个字节存储一个国标码 由于一个字节只能表示28(256)种编码,显然用一个字节不可能表示汉字的国标码,所以一个国标码必须用两个字节来表示。 上一页 下一页
1.3.5 汉字的编码 1.汉字信息交换码 (3)国标码的编码范围 1.3.5 汉字的编码 1.汉字信息交换码 (3)国标码的编码范围 为了中英文兼容,国标GB2312-80规定,国标码中所有字符的每个字节的编码范围与ASCII码表中的94个字符编码相一致,所以,其编码范围是2121H~7E7EH(共可表示94×94个字符)。 (4)国标码是区位码 类似于ASCII码表,国标码也有一张国标码表。简单地说,把7445个国标码放置在一个94行×94列的阵列中。阵列的每一行称为一个汉字的“区”,用区号表示;每一列称为一个汉字的“位”,用位号表示。区号范围是1~94,位号范围也是1~94。这样,一个汉字在表中的位置可用它所在的区号与位号来确定。一个汉字的区号与位号的组合就是该汉字的“区位码”。实际上,区位码也是一种输入法,其最大优点是一字一码的无重码输入法,最大的缺点是难以记忆。 上一页 下一页
1.3.5 汉字的编码 2.汉字输入码 为将汉字输入计算机而编制的代码称为汉字输入码,也叫外码。汉字输入码都是由键盘上的字符或数字组合而成,它是根据汉字的发音或字形结构等多种属性及有关规则编制的,目前流行的汉字输入码的编码方案已有许多,如全拼输入法、双拼输入法、自然码输入法、五笔输入法等。可分为音码、形码、音形结合码3大类。 数字编码(顺序码)如:区位码、电报码 字音编码(音 码)如:拼音码、自然码 字形编码(形 码)如:五笔字型码、表形码 音形编码 如:双拼码 上一页 下一页
1.3.5 汉字的编码 3.汉字内码 汉字内码是为在计算机内部对汉字进行存储、处理而设置的汉字编码。当一个汉字输入计算机后就转换为内码,然后才能在机器内传输、处理。对应于国标码,汉字的内码也用2个字节存储,并把每个字节的最高位置“1”作为汉字内码的标识。也就是说,国标码的两个字节每个字节最高位置“1”,即转换为内码。 1 国标码第一字节 1 国标码第二字节 内码 “补”:国标码“3239H” 00110010 00111001 10110010 10111001 “补”:机内码“B2B9H”
1.3.5 汉字的编码 4.汉字字形码 汉字信息处理系统中产生汉字字形的方式,大多以点阵的方式形成汉字,汉字字形码也就是指确定一个汉字字形点阵的编码,也叫字模或汉字输出码。 汉字是方块字,将方块等分成有n行n列的格子,简称为点阵。点阵中各点用0,1表示,构成的二进制串就形成了汉字字形码。 汉字点阵类型 点阵 占用字节数 简易型 1616 32 普及型 2424 72 提高型 3232 128 精密型 4848 288 点阵越大,字形的质量越好,但存储汉字字形码所占用的存储空间也就越大。
1.3.5 汉字的编码 各种汉字代码之间的关系 汉字信息的数字化 输入码 机内码 交换码(国标码) 字形码 显示输出 打印输出