Download presentation
Presentation is loading. Please wait.
1
第四章 数制和信息编码 4.1 引言 4.2 数制与运算 4.3 数据存储单位和内存地址 4.4 信息编码
2
4.1 引言 1.信息社会和数字化社会 工业社会? 物质和能源是主要资源,从事的是大规模的物质生产 信息社会?
信息成为比物质和能源更为重要的资源,以开发和利 用信息资源为目的信息经济活动成为国民经济活动的主 要内容。 特征:社会信息化、设备数字化、通信网络化 动力:以3C为核心的现代信息技术快速发展 重要技术基础:数字化
3
2.信息和数据 数据:对客观事物的性质、状态以及相互关系等进行 记载的物理符号。 信息:数据经过加工以后、并对客观世界产生影响的 数据。
数据:对客观事物的性质、状态以及相互关系等进行 记载的物理符号。 信息:数据经过加工以后、并对客观世界产生影响的 数据。 区别:信息有意义,而数据没有。 注意:在计算机中经常将信息和数据这两个词不加以 严格区分,互换使用。
4
3.编码 什么是编码? 用数字、字母等按规定的方法和位数来代表特定的信息。 目的:为了人与计算机之间信息交流和处理。
在计算机中要将数值、文字、图形、图像、声音等各种 数据进行二进制编码才能存放到计算机中进行处理,编码 的合理性影响到占用的存储空间和使用效率。
5
例如九九乘法55种运算 二进制3种运算 1×1=1 0×0=0 1×0=0×1=0 4.计算机为什么采用二进制编码?
物理上容易实现,可靠性强 运算简单,通用性强 便于表示和进行逻辑运算
6
4.2数制与运算 我将编号写下后,就能猜出这个数 请某同学在纸上写一个小于 50 的数
猜数字游戏 请某同学在纸上写一个小于 50 的数 接着,请该同学告诉大家所写的数出现在以下的 6 张卡片中的哪几张卡片里?并将编号告之。 为什么? 真的吗? 我将编号写下后,就能猜出这个数
7
0#卡片 1#卡片 2#卡片 3#卡片 5#卡片 4#卡片
8
各种进制数的表示法 规则 基数 2 8 10 16 数符 权值 2的x次方 8的x次方 10的x次方 16的x次方 进位制 二进制 八进制
十进制 十六进制 规则 逢2进1 逢8进1 逢10进1 逢16进1 基数 2 8 10 16 数符 A B C D E F 权值 2的x次方 8的x次方 10的x次方 16的x次方 形式表示 B(BIN) O(OCT) D(DEC) H(HEX)
9
各种进制数之间的转换规则 以十进制为基本进制: (1)其它进制转化为十进制,按位值 乘以权值(基数的N-1次方);
(2) 十进制转化为其它进制, 整数部分除基数取余, 小数部分乘基数取整。
10
4.2.1*十进制数与二进制数间的转换 (10011)2 (19)10=(10011)2 余数 低位 4 注意:2的0次方等于1,不是0
A. “十进制”转“二进制” B. “二进制”转“十进制” (10011)2 2 19 余数 低位 1 4 2 9 1 =1*2 +1*2 4 1 2 2 +1*2 2 注意:2的0次方等于1,不是0 1 2 1 =16+2+1 高位 (19)10=(10011)2 =19
11
练 习 将刚才游戏中同学写的数字转换为二进制数 将011101转换为十进制数 记下这两个数的两种进制结果然后回到游戏中观察思考 分析
小数怎么转?其它进制怎么转?
12
*十进制数与八进制数间的转换 (23)8 (19)10=(23)8 余数 低位 1 高位 A. “十进制”转“八进制”
B. “八进制”转“十进制” (23)8 8 19 余数 低位 8 2 3 1 =2*8 +3*8 2 =16+3 高位 =19 (19)10=(23)8
13
*十进制数与十六进制数间的转换 (1B)16 B代表的数是多少? (27)10=(1B)16 余数 低位 1 高位
A. “十进制”转“十六进制” B. “十六进制”转“十进制” (1B)16 16 27 余数 低位 1 16 1 11 =1*16 +11*16 1 =16+11 B代表的数是多少? 写成(111)16 行吗? 高位 =27 (27)10=(1B)16
14
R进制数用 r个基本符号(0,1,2,…,r-1)表示数码
R进制数N 展开式可表示为: N=an-1×rn-1+an-2×rn-2+…+a0×r0+a-1×r-1+…+a-m×r-m
15
十进制转化成r进制 整数部分:除以 r取余数,直到商为0,余数从右到左排列。 小数部分:乘以 r取整数,整数从左到右排列。
例 (D)≈ .01011(B) 100(D)=144(O)=64(H) 0.345 2 0.690 0.760 1.520 100 2 50 25 12 6 3 1 八进制 100 8 12 1 4 16 6 十六进制 1.380 1.04
16
4.2.2二进制、八进制、十六进制数间的关系 八进制 对应二进制 十六进制 000 0000 8 1000 1 001 0001 9 1001 2 010 0010 A 1010 3 011 0011 B 1011 4 100 0100 C 1100 5 101 0101 D 1101 6 110 0110 E 1110 7 111 0111 F 1111
17
*二进制数与八进制数间的转换 关键点(技巧):因为2的3次方等于8,所以 3位二进制数等于1位八进制数。
A. “二进制”转“八进制” B. “八进制”转“二进制” 关键点(技巧):因为2的3次方等于8,所以 3位二进制数等于1位八进制数。 (10111) 2=( ) 2 =( ) 8 ( ) 8 =( ) 2 =( 10111) 2 前面补0成3位一组
18
*二进制数与十六进制数间的转换 关键点(技巧):因为2的4次方等于16,所以 4位二进制数等于1位十六进制数。
A. “二进制”转“十六进制” B. “十六进制”转“二进制” 关键点(技巧):因为2的4次方等于16,所以 4位二进制数等于1位十六进制数。 (101111) 2=( ) 2 =( F ) 16 ( A F ) 16 =( ) 2 =( ) 2 前面补0成4位一组 注意不能写成15
19
以二进制数为中介,先将要转换的进制数化为二进制数,再转换成目的进制数。
*八进制数与十六进制数间的转换 以二进制数为中介,先将要转换的进制数化为二进制数,再转换成目的进制数。 如: ( 7 3 ) 8 =( ) 2 =( ) 2 =( B ) 16 注:二进制的 1011等于十六进制的11, 用 B 表示。 反之,亦然。
20
4.2.3 二进制数的算术运算 1.加法运算 0+0=0 0+1=1+0=1 1+1=0 (按逢二进一向高位进位1) 2.减法运算
0-0=1-1=0 1-0=1 0-1=1 (本位为1,向高位借位)
21
3.乘法运算: 实现方法移位相加运算 4.除法运算: 实现方法移位相减运算
22
4.2.4 二进制数的逻辑运算 1.逻辑非运算 2.逻辑与运算 应用举例:选拔干部,同时满足条件:年龄小于35岁,党员,高级工程师
23
3.逻辑或运算 应用举例:选拔干部,满足条件之一:年龄小于35岁,党员,高级工程师
24
4.3 数据存储单位和内存地址 1.数据的存储单位 bit :数据存储的最小单位 Byte:一般用字节来作为计算机存储容量的基本单位
常用的单位之间的换算关系为: 1KB=210B=1024B 1MB=220B=1024KB 1GB=230B=1024MB 1TB=240B=1024GB
25
2.内存地址和数据存放 内存:以字节Byte为单位,每个字节有唯一的地址, 就可方便地存取数据。 数据存放:不同的数据类型占据的字节数不同。
int n=100; //占4个字节 double x=3.56; //占8个字节
26
4.4信息编码 存储 处理
27
4.4.1数值数据 -108 问题:数值在计算机中二进制形式存放, 则正负符号、小数点如何表示? 解决符号问题:
最高位符号位,“0”表示正,“1”表示负数 其余位为数值位。 -108 1 符号位S
28
解决小数点问题: 问题:若一个数占1个字节 1.有符号数最大值多少?超出该值称为什么? 2.无符号数最大值多少?
S 定点整数 小数点 无符号位 纯小数 问题:若一个数占1个字节 1.有符号数最大值多少?超出该值称为什么? 2.无符号数最大值多少? 3.若占2个字节的有符号数最大值为多少?
29
问题: 当要存放很大或很小的数怎么办? 解决的方法浮点数(指数形式)存放
30
浮点数(指数形式) 在数学中,一个实数可以用指数形式表示: N=±d×10±p
例如: = ×103= ×10-1=… 式中:d是尾数,前面的“±”表示数符; p是阶码,前面的“±”表示阶符。 同样,任意二进制浮点数的表示形式: N=±d×2±p (B)= ×2+3= ×2+2= ×2-2=…
31
求:-5+4? 解决运算问题:机器数和真值 机器数:把符号“数字化”的数,是数字在计 算机中的二进制表示形式。
机器数:把符号“数字化”的数,是数字在计 算机中的二进制表示形式。 真值:直接用“+”、“-”来表示的二进制数. 例如:-99,机器数 真值 求:-5+4? 问题:若符号位参加运算,结果错; 若考虑符号位,则运算变得复杂; 怎么解决?引入数的编码
32
负数反码:符号位1,其余为该数的绝对值取反 负数补码:符号位1,其余为该数的绝对值取反加1
数的编码 实质:是对带符号数的不同编码 常用:原码 、反码、 补码。 负数原码:符号位1,其余为该数的绝对值 (1)原码 0X 1|X| 0<=X X<=0 +7: : - 7: : [X]原= 负数反码:符号位1,其余为该数的绝对值取反 负数补码:符号位1,其余为该数的绝对值取反加1
33
小结: 例: (-5)+4 2.补码与原码的转换过程几乎是相同的。 已知:-55的补码为 :10111001 原码为?
1.在计算机系统中,数值一律用补码来表示。 主要原因: 使用补码,可以将符号位和数值位统一处理 例: (-5)+4 同时,减法也可按加法来处理。 2.补码与原码的转换过程几乎是相同的。 已知:-55的补码为 : 原码为?
34
4.4.2字符编码 举例你常用到那些编码? 邮政、电话、身份证等 问题: 职称编码的规律?好处? 用一定位数的数字或代码唯一地表示某些信息
问题的提出:我校学生用7位编码,原因? 学号 、 、 等的含义? 什么是编码? 问题: 职称编码的规律?好处? 用一定位数的数字或代码唯一地表示某些信息 举例你常用到那些编码? 职称编码 教师 科研 工程 011 研究员 061 教授级高工 副研 高工 助研 工程师 083 014 见习 助工 019 未定职 未定职 089 邮政、电话、身份证等 教授 副教授 讲师 助教 未定职
35
(American Standard Code for Information Interchange)
西文字符:ACSII码 (American Standard Code for Information Interchange) 用7位二进制编码,最高位0 问题:为什么用7位? 0~127共可表示128个字符 ‘A’~‘Z’ 26 ‘a’~’z’ 26 ‘0’~’9’ 10 其他键盘字符、控制键 <=128 0~32、127为非图形字符,其余94个图形字符 EBCDIC 扩展二十进制编码 8位
36
例如:“a”字符的编码为01100001,对应的十进制数是97;
需记字符和规律: 换行 AH 回车 DH 空格 H ‘0’~‘9’ 30H~39H 48~57 ‘A’~‘Z’ 41H~5AH 65~90 ‘a’~‘z’ 61H~7AH 97~122 例如:“a”字符的编码为 ,对应的十进制数是97; 问题:存放了 计算机怎么知道是字符还是数值?
37
汉字编码 (1) 输入码 (2) 国标码(GB2312-80) 形码类:五笔字型法、郑码输入法、表形码等 。
键盘输入 屏幕 打印机 输入码 国标码 机内码 字形码 输出 (1) 输入码 音码类:全拼、双拼、微软拼音、自然码和智能ABC等 形码类:五笔字型法、郑码输入法、表形码等 。 (2) 国标码(GB2312-80) 每个汉字占两个字节,为什么 ? 最高位0, 27×27=16129 一级汉字:3755个;二级汉字:3008个。
38
每个汉字的区号和位号各加32(20H)就构成了国标码 加32的原因:为了与ASCII码兼容,每个字节值大于32 (0~32为非图形字符码值)
汉字的国标码与区位码的关系: 每个汉字的区号和位号各加32(20H)就构成了国标码 加32的原因:为了与ASCII码兼容,每个字节值大于 (0~32为非图形字符码值)
39
机内码=国标码+80 80H=区位码+A0 A0H (3)机内码 汉字在设备或信息处理系统内部最基本的表达形式。 三种码之间关系:
(3)机内码 汉字在设备或信息处理系统内部最基本的表达形式。 为了在计算机内部能够区分是汉字编码还是ASCII码 ,将国标码每个字节最高位设置为1(80H B). 国标码 “中” (56 50)H ( )B 机内码 (D6 D0)H ( )B 三种码之间关系: 机内码=国标码+80 80H=区位码+A0 A0H
40
点阵 FON 矢量 TTF (4) 汉字字形码 点阵:汉字字形点阵的代码 有16×16、24×24、32×32、48×48等
编码、存储方式简单、无需转换直接输出 放大后产生的效果差 思考: 24×24点阵一个汉字占多少字节? 矢量:存储的是描述汉字字形的轮廓特征 矢量方式特点正好与点阵相反 点阵 FON 矢量 TTF
41
国际标准,统一地表示世界上的主要文字。制定了三套编码方式:
Unicode字符集编码 国际标准,统一地表示世界上的主要文字。制定了三套编码方式: UTF-8:以8位序列来编码的,用一个或几个字节来表 示一个字符。与ASCII码兼容。 UTF-16:两个字节或称16位编码 UTF-32:四个字节或称32位编码 ASCII 0xxxxxxx 不同字符编码的存储 0xxxxxxx GB GB机内码 1xxxxxxx UTF-16 码 xxxxxxxx
42
本节主要内容 数制及不同数制间的转换 二、八、十六进制与十进制 数值数据存放 符号: 原码、反码、补码 小数点:浮点数 字符数据存放
西文字符编码:ASCII码 汉字编码:国标码、Unicode码
43
4.4.3多媒体信息编码—音频 多媒体分类:通常,人们将文本、音频、视频、图形、图像、动画的综合体笼统称为“多媒体”。由此可见,多媒体信息包括以下5种: 文本 图形、图像 动画 声音 视频影像
44
多媒体 多媒体 多媒体 文字和符号 多媒体概述 各类文字和符号
45
矢量图形对象 ● 文字 图形 通过计算而描述的矢量图形
46
位图图像对象 ● 文字 图形 图像 用像素点描述的自然影像
47
动画对象 单画面矢量动画和多画面帧动画 文字 图形 单画面矢量动画 图像 动画 多画面帧动画 ●
FRAME FRAME FRAME FRAME FRAME FRAME FRAME 07 单画面矢量动画和多画面帧动画
48
音频对象 ● 文字 ● midi音频 ● wav音频 ● mp3压缩音频 图形 图像 动画 音频 音频数字信号、压缩音频信号
49
视频对象 END 文字 图形 图像 动画 音频 视频 音频 + 视频 Audio Vedio Information
● 文字 END 图形 图像 动画 音频 视频 音频 + 视频 Audio Vedio Information 视频数字信号AVI、压缩视频信号MPG
50
一、音频信息 1.基本概念 声波:声源体发生振动会引起四周空气振荡,振荡方式就是声波。 复杂的声波由许多具有不同振幅和频率的正弦波组成。
一、音频信息 1.基本概念 声波:声源体发生振动会引起四周空气振荡,振荡方式就是声波。 复杂的声波由许多具有不同振幅和频率的正弦波组成。 周期T:重复出现的时间间隔; 振幅A:波形相对基线的最大位移,表示音量的大小; 频率f:信号每秒钟变化的次数,即1/T以赫兹(Hz)为单位。
51
正常人所能听到的声音频率范围为20 Hz~20 kHz。
声音按频率分类 正常人所能听到的声音频率范围为20 Hz~20 kHz。 声音质量的频率范围: CD 如随身听 FM:调频 AM:调幅 把调制信号从低频搬移到了高频,以便利用电离层传播, 调频声音的高低变为频率的变化的电信号, 调幅就是用声音的高低变为幅度的变化的电信号.
52
2.模拟音频的数字化 用计算机对音频信息处理,就要将模拟信号(如语音、音乐等)转换成维数字信号。 模拟信号 采样 量化 编码 数字信号
振幅 频率 1/T 采样点 T 采样 每隔一定时间间隔对模拟 波形上取一个幅度值。 量化 将每个采样点得到的幅度值 以数字存储。 编码 将采样和量化后的数字数据 以一定的格式记录下来 振幅 1/T T
53
3.数字音频的技术指标 采样频率、量化位数和声道数 采样频率: 每秒钟的采样次数
量化位数(采样精度) :存放采样点振幅值的二进制位数。通常 量化位数有8位、16位,分别表示有28、216个等级。 声道数 :声音通道的个数 ,立体声 为双声道。 每秒钟存储声音容量的公式为: 采样频率×采样精度×声道数/8=字节数 例如,用44.10 kHz的采样频率,16位的精度存储,则录制1秒钟的立体声节目,其WAV文件所需的存储量为: 44 100×16×2/8= (字节)
54
采样频率和量化参数比较
55
4.数字音频的文件格式 Wave格式文件(. Wav) 记录了真实声音的二进制采样数据,通常文件较大。 MIDI格式文件(.MID)
数字音乐的国际标准. 记录的是音符数字,文件小。 MPEG音频文件(.MP1/.MP2/.MP3) 采用MPEG音频压缩标准进行压缩的文件。 RA格式文件(.ra) RA(Real Audio)是Real Network公司制定的音频压缩规 范,有较高的压缩比,采用流媒体的方式在网上实时播放。
56
4.4.4多媒体信息编码—数字图像及处理 1.基本概念 图形和图像 图形:由点、线等组成的有边界画面,文件中存放描述图形的指令。
图像:由图像设备输入的无边界画面,数字化后以位图形式存储。 图形与图像的数字化 分辨率(行、列)和颜色深度 真彩色每个像素点占3个字节,224= 种颜色。 计算存储一秒图像公式: 列数×行数×像素的颜色深度/8 ×帧/秒=字节数 例:1280×1024分辨率的“真彩色”电视图像, 按每秒30帧计算,显示1分钟,则需要: 1280×1024×3×30×60 ≈ 6.6 GB
57
2.图像的数字化 采样 用多少个像素点的“列数×行数”表示,分辨率越高,图像越清晰,存储量也越大。 量化
量化是在图像离散化后,将表示图像色彩浓淡的连续变化值离化为整数值的过程。 把量化时所确定的整数值取值个数称为量化级数,也称为颜色深度. 图像 采样 量化 数字图像
58
颜色深度 灰度图 彩色图 ①黑白图 图像的颜色深度为1,则用一个二进制位1和0表示纯白、纯黑两种情况;
①黑白图 图像的颜色深度为1,则用一个二进制位1和0表示纯白、纯黑两种情况; ②灰度图 图像的颜色深度为8,占一个字节,灰度级别为256级。通过调整黑白两色的程度(称颜色灰度)来有效地显示单色图像; ③RGB 24位真彩色 彩色图像显示时,由红、绿、蓝三基色通过不同的强度混合而成,当强度分成256级(值为0~255),占24位,就构成了224= 种颜色的“真彩色”图像。 灰度图 彩色图
59
图像的分辨率和像素位的颜色深度决定了图像文件的大小,计算公式为:
列数×行数×颜色深度÷8=图像字节数 例8.2 当要表示一个分辨率为640×480的“24位真彩色”图像,则需要: 640×480×24÷8≈1MB 由此可见,数字化后的图像数据量十分巨大,必须采用编码技术来压缩信息。它是图像传输与存储的关键。
60
2.常用图像文件格式 BMP格式文件 与设备无关的位图格式文件,Windows环境中经常使用. GIF格式文件
Internet上的重要文件格式之一,最大不超过64 KB, 256色以内,压缩比较高,与设备无关。 JPEG格式文件(.JPG) 利用JPEG方法压缩, Internet上重要文件格式之一, 适用于处理256色以上、大幅面图像。 WMF格式文件 位图与矢量图的混合体, Windows中许多剪贴画图像 是以该格式存储的。广泛应用于桌面出版印刷领域。
61
3. 图像数据的获取 利用图像处理软件和现成的图像库
最常用的是Photoshop,可以绘图,也可以编辑来自网络、CD-ROM光盘上存储的图像库 “画图”程序可以获取屏幕界面 利用数字化设备获取 数码相机、数字摄象机,将拍摄的自然界景物按数字格式存储通过连接转换转换成计算机中的图像和影象文件。 扫描仪将照片、艺术作品转换成数字图像文件。
62
三、 视频 视频是将一幅幅独立图像组成的序列按照 一定的速率连续播放,利用视觉暂留现象 在人的眼前呈现出连续运动的画面。
模拟视频常用两种标准: NTSC制式(30帧/秒,525行/帧) PAL制式(25帧/秒,625行/帧),我国采用PAL制式。 例1分钟的数字视频容量 640×480 ×3 ×30 ×60 = 字节 分辨率 采样深度 帧/秒 时间
63
常用视频文件格式 AVI(Audio-Video Interleaved)文件
将视频与音频信息交错地保存在一个文件中,较好地解决了音频与视频的同步问题,已成为Windows视频标准格式文件。 MOV文件 利用它可以合成视频、音频、动画、静止图像等多种素材。 MPG(.mpg)文件 是按照MPEG标准压缩的全屏视频的标准文件。 DAT文件 是VCD专用的格式文件,文件结构与MPG文件格式基本相同。
64
数据压缩技术 数字化了的视频和音频信号的数量之大是非常惊人的。 带来的问题 占用存储容量 降低通信干线的信道传输率
影响计算机的处理速度和播放效果 问题的解决:数据压缩 数据压缩:一般可以分为有损压缩和无损压缩两种。
65
数据压缩技术的性能指标 ②恢复效果 即要尽可能恢复到原始数据 ③速度 即压缩、解压缩的速度 ④开销 实现压缩的软、硬件开销要小
①压缩比: 即压缩前后所需的信息存储之比要大; ②恢复效果 即要尽可能恢复到原始数据 ③速度 即压缩、解压缩的速度 ④开销 实现压缩的软、硬件开销要小
66
这类算法主要特点是压缩比较低,为2:1~5:1,一般用来压缩文本数据或计算机绘制的图像(色彩不丰富)。
无损压缩(解压缩后信息不失真,可逆) 这类算法主要特点是压缩比较低,为2:1~5:1,一般用来压缩文本数据或计算机绘制的图像(色彩不丰富)。 典型的编码: 行程编码:对连续出现的符号用一个计数值来表示,能确保解压后的数据不失真 。 例用于文字压缩: AAAAABBBBCCDDDDDD 5A4B2C6D Huffman编码 编码思想:出现频率较高的符号采用短码字,出现频率较低的符号采用较长的码字,以达到缩短平均码长来实现数据的压缩。
67
2. 有损压缩 3.数据压缩的国际标准 有损压缩方法是以牺牲某些信息(这部分信息基本不影响对原始数据的理解)为代价,换取了较高的压缩比。
广泛用于语音、图像和视频数据的压缩。 3.数据压缩的国际标准 JPEG标准 适用于连续色调和多级灰度的静态图像 MPEG标准 适用于运动图像、音频信息。包括MPEG视频、MPEG音频、MPEG系统(视频和音频的同步)。MPEG已制定了MPEG-1、MPEG-2、MPEG-4和MPEG-7四种。
Similar presentations