Download presentation
Presentation is loading. Please wait.
1
2.3 信息表示与编码 所谓编码,就是利用数字串来标识所处理对象的不同个体。
2.3 信息表示与编码 所谓编码,就是利用数字串来标识所处理对象的不同个体。 在计算机中采用二进制意味着所有需要计算机存储并处理的信息,如数值、字母、汉字及其它各种符号、声音、图形、图像等,都要转换成二进制的形式来表示,即0和1的编码。 整数的表示 在数学中的计算数值是用“+”和“-”表示正数和负数的,在计算机中只有0和1,所以正负号也用0和1表示,即数值符号数字化。
2
2.3 信息表示与编码 符号位:将二进制数的最高位用于表示“正”或“负”。其中0表示为正,1表示为负。 机器数:正负符号被数值化了的数。
2.3 信息表示与编码 符号位:将二进制数的最高位用于表示“正”或“负”。其中0表示为正,1表示为负。 机器数:正负符号被数值化了的数。 真值:该机器数所表达的数值。 机器数 1 +5 符号位 真值 机器数 1 -5 真值 符号位
3
在有符号运算中,需要通过原码、反码、补码转换来完成运算。
2.3 信息表示与编码 整数的表示 在有符号运算中,需要通过原码、反码、补码转换来完成运算。 原码:正号为0,负号为1,数值部分为二进制绝对值。 反码:正数的反码和原码相同;负数的反码是将其原码除符号位外各位取反。 补码:正数的补码和原码相同;负数的补码是将其反码在末位加1。 +5的原码、反码和补码都是 -5 1 原码 反码 补码
4
2.3 信息表示与编码 2.3.1 整数的表示 补码的概念是怎么来的?
2.3 信息表示与编码 整数的表示 补码的概念是怎么来的? “模”是指一个系统所能表示的数据个数。按模运算是指运算结果超过模时,模(或模的整数倍)将溢出而只剩下余数。 8位二进制的模为28=256 假设M为模,若数a,b满足a+b=M,则称a,b互为补数。 在有模运算中,减去一个数等于加上这个数对模的补数。
5
定点数 2.3 信息表示与编码 定点整数: 2.3.2 实数的表示 小数点位置固定的数称为定点数。
2.3 信息表示与编码 实数的表示 定点数 小数点位置固定的数称为定点数。 定点整数:小数点隐含固定在数值部分最右端。定点整数是纯整数,其符号位右边所有的位数表示的是一个整数。 定点整数: (-3) 1 隐含小数位 符号位
6
2.3 信息表示与编码 定点小数: 2.3.2 实数的表示 定点小数:小数点隐含固定在数值部分最左端。定点小数是纯小数。 (+0.5) 1
2.3 信息表示与编码 实数的表示 定点小数:小数点隐含固定在数值部分最左端。定点小数是纯小数。 定点小数: (+0.5) 1 隐含小数位 符号位
7
2.3 信息表示与编码 实数的表示 浮点数 小数点位置不固定的数称为浮点数,它既有整数部分又有小数部分,如123.55、33.789等。 在计算机中通常把浮点数分成阶码和尾数两部分来表示,也就是平时所说的科学记数法 。为保证不损失有效数字,对尾数进行规格化处理,即保证尾数的最高位为1,实际数值通过阶码进行调整。例如,二进制实数 可以用 ×2100表示。(注:100等同于十进制的4)
8
2.3 信息表示与编码 2.3.2 实数的表示 浮点数:字长4字节,则阶码部分为8位补码定点整数,尾数部分为24位补码定点小数。
2.3 信息表示与编码 实数的表示 浮点数:字长4字节,则阶码部分为8位补码定点整数,尾数部分为24位补码定点小数。 例:将十进制数 +55 以浮点数格式存放。 (55)10 = (110111)2 = * 26 尾数最高位为1 (注:6等同于二进制的110) 1 1 1 1 1 1 … 阶码 符号位 阶码部分 尾数 符号位 尾数部分
9
2.3 信息表示与编码 2.3.2 实数的表示 例:将十进制数 -55 以浮点数格式存放。 (略)
2.3 信息表示与编码 实数的表示 例:将十进制数 -55 以浮点数格式存放。 (略) -(55)10 = -(110111)2 = * 26 其中( )的反码为: ,补码: 尾数格式:0.1001(小数点右移2位,指数变为24) 尾数最高位为1 隐含小数位 1 1 1 1 … 阶码 符号位 阶码部分 尾数 符号位 尾数部分
10
BCD码(8421码):二-十进制编码,用4位二进制码表示1位十进制数。(不能参与运算) 例:
2.3 信息表示与编码 编码和数值是完全不同的! 十进制数的编码——BCD码 BCD码(8421码):二-十进制编码,用4位二进制码表示1位十进制数。(不能参与运算) 例: (13579)10 =( )BCD ( )BCD =( )10
11
2.3 信息表示与编码 2.3.4 西文字符的编码——ASCII码
2.3 信息表示与编码 西文字符的编码——ASCII码 b6b5b4 b3b2b1b0 000 001 010 011 100 101 110 111 0000 NUL DLE SP @ P ` p 0001 SOH DC1 ! 1 A Q a q 0010 STX DC2 “ 2 B R b r 0011 ETX DC3 # 3 C S c s 0100 EOT DC4 $ 4 D T d t 0101 ENQ NAK % 5 E U e u 0110 ACK SYN & 6 F V f v 0111 BEL ETB ‘ 7 G W g w 1000 BS CAN ( 8 H X h x 1001 HT EM ) 9 I Y i y 1010 LF SUB * : J Z j z 1011 VT ESC + ; K [ k { 1100 FF FS , < L \ l | 1101 CR GS - = M ] m } 1110 SO RS . > N ^ n ~ 1111 SI US / ? O _ o DEL ASCII码(American Standard Code for Information Interchange) 128个常用字符,用7位二进制编码,占一个字节,最高位0。 其中,控制字符:0~32,127;普通字符:94个。
12
2.3 信息表示与编码 2.3.5 和汉字有关的编码 汉字输入码:操作人员通过键盘输入的汉字编码。 数字编码:如区位码;
2.3 信息表示与编码 和汉字有关的编码 汉字输入码:操作人员通过键盘输入的汉字编码。 数字编码:如区位码; 拼音编码:如全拼、智能ABC、微软拼音输入法等; 字形编码:如五笔字型法等 。
13
2.3 信息表示与编码 (2) 国标码和区位码 1980年颁布(GB ) ,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区使用的中文编码。每个汉字占两个字节的编码。 该编码共收录6763个简体汉字、682个符号,其中汉字部分:一级汉字:3755个,以拼音排序 ;二级汉字:3008个,以偏旁排序 。 所有汉字分94个区,每个区94个汉字。由此构成区位码。而区位码的区码和位码各加32就得到国标码。
14
2.3 信息表示与编码 (3) 机内码 计算机内部存储和加工汉字所用的编码。不管用哪一种汉字输入法输入的汉字,在计算机内部都是由国标码转换成机内码来表示的。 每个汉字的机内码占两个字节,每个字节最高位为1。 汉字 国标码 汉字机内码 中 8680( )2 ( )2 华 5942( )2 ( )2 中 5448(区位码) 华2710 (区位码) 注:十进制表示的国标码的每个字节减32即得区位码。
15
2.3 信息表示与编码 (4) 汉字字形码 汉字存储在计算机内采用机内码,但输出时必须转换成字形码,再根据字形码输出汉字。字形码又称汉字字模,用于在显示器或打印机上输出各种文字和符号。通常有两种: 点阵汉字:每一个汉字以点阵形式存储,有点的地方为“1”,空白的地方为“0”。有16×16、24×24、48×48点阵等。点阵越大,字形分辨率越好,字形也越美观,但汉字存储的字节数就多,字库也就越庞大。
16
2.3 信息表示与编码 和汉字有关的编码 矢量汉字:将汉字的笔画轮廓用一组直线和曲线来勾画,并记录存储每一直线和曲线的数字描述(端点及控制点的坐标)。在需要输出时,根据字形轮廓的描述计算出汉字点阵。矢量产生的汉字即使放大仍能保持较好的质量。 汉字字库一般都存放在磁盘上,这种字库称为“软字库”,使用时根据汉字内码到字库中找到相应的字形码,然后调入内存并显示或打印。
17
2.3 信息表示与编码 计算机处理汉字的基本过程 用户用键盘输入汉字的外码(输入码),然后通过代码转换程序到码表中去检索机内码,汉字内码负责对汉字进行储存、处理、加工。输出时,利用字形检索程序在汉字字模库中查到表示这个汉字的字形码,然后在显示器或打印机上输出。
18
2.3 信息表示与编码 2.3.5 和汉字有关的编码 (5) 其它编码
2.3 信息表示与编码 和汉字有关的编码 (5) 其它编码 GBK编码:是对GB2312的扩充。仍采用双字节编码,在此基础上对罕见汉字使用四字节编码,共收录了2.7万个汉字,与国标码兼容,同时收录了藏、蒙、维吾尔等主要少数民族文字。 BIG5码:台湾、香港等地区使用的繁体汉字编码标准。
19
2.3 信息表示与编码 2.3.5 和汉字有关的编码 (5) 其它编码
2.3 信息表示与编码 和汉字有关的编码 (5) 其它编码 UCS码:国际标准化组织公布的可以容纳全世界所有语言文字的编码方案。全球可以共享的编码字符集。采用4字节编码。 Unicode:UCS码的一个子集,采用2字节表示世界上经常使用的主要文字,如字母、音节文字、符号、中日韩文字、专用字符、兼容字符等。
20
2.3 信息表示与编码 多媒体信息的数字化 数字化就是对模拟世界的一种量化,表示信息的最小单位是位(bit)——“0”或“1”。多媒体信息在计算机中也要转换为0和1,因此也需要进行编码。也就是说无论是文字、图像、声音或视频,数字化后都可分解为一系列0或1的排列组合。各种多媒体信息在进入到计算机中进行运算、存储、传输等过程中,需要进行数字化处理,输出时再将其还原成各自本身的特性呈现在我们面前。
21
2.3 信息表示与编码 2.3.6 多媒体信息的数字化 数值 西文 汉字 声像 十—二进制转换 ASCII码 输入码—机内码 模数转换
2.3 信息表示与编码 多媒体信息的数字化 数值 西文 汉字 声像 十—二进制转换 ASCII码 输入码—机内码 模数转换 二—十进制转换 西文形码 汉字字形码 数模转换 内存 各种多媒体信息的数字化处理过程示意图
Similar presentations