Presentation is loading. Please wait.

Presentation is loading. Please wait.

   本课件为教师罗英伟参加信息学院青年教师教学基本功比赛时所作,当时获得信息学院一等奖。其内容为北京大学本科生主干必修课“计算概论”中的一节。

Similar presentations


Presentation on theme: "   本课件为教师罗英伟参加信息学院青年教师教学基本功比赛时所作,当时获得信息学院一等奖。其内容为北京大学本科生主干必修课“计算概论”中的一节。"— Presentation transcript:

1    本课件为教师罗英伟参加信息学院青年教师教学基本功比赛时所作,当时获得信息学院一等奖。其内容为北京大学本科生主干必修课“计算概论”中的一节。

2 第六讲 人机互动 ——与计算机的信息交流 北京大学信息科学技术学院

3 主要内容 数制及其转换 二进制数的运算 数字化原理 信息的输入与输出 汉字的输入/输出过程 多媒体技术

4 三、数字化原理 指令编码 数值表示 字符编码 颜色编码 声音编码 图像编码 影像编码 基本编码规则

5 三、数字化原理 “冯.偌依曼体系结构” 的基本思路: 采用二进制形式表示数据和指令。
程序与数据预先存入主存,工作时连续自动高速顺序执行。即“存储程序”思想。 由运算器、存储器、控制器、I/O设备五大部分组成。。 在现在的计算机内部,一律采用二进制表示数据和指令。

6 三、数字化原理 计算机内的数据 二进制:存储,基本表示格式。虽然世界上信息的表现形式多种多样,在计算机里它们的形式得到了概括和统一。任何信息在计算机中都以二值的数字形式被存储、被处理,还通过各种通讯媒体被传输和接收。 编码:赋予意义,基本的共识性数据,如字符、数值、颜色、图像、声音、影像等。很多应用程序可以解释它们。 数据结构:复杂数据,各种数据的组合,如Word文件、地图等,其中可以包括字符、数字、图像、声音等,往往只有特定的应用软件才能解释。

7 三、数字化原理 ——指令的编码 每条指令,都用固定长度的二进制数表示
将计算机内部所能进行的各种基本操作用二进制数表示出来,以便于计算机的识别于运行。如: 加法 减法 乘法 除法 跳转 …… 则: 可以表示为 2 * 4 可以表示为 每条指令,都用固定长度的二进制数表示

8 三、数字化原理 ——数值的表示 在计算机内部,由于要表示符号等因素,因此并不是直接以原始的二进制数本身来存储的,而是要经过一定的编码,包括:原码、补码和反码。有关这三种码的含义及其所表示的数据的方式(整数和浮点数),有兴趣的同学可以在课后阅读有关文献。 此外,计算机内用来表示数据的二进制位数也不是无限的,往往用固定位数来表示数据,因此,其表达的数据范围是有限的(在“程序设计”中会涉及): 8位:0~255(28 - 1) 16位:0~65535( ) 32位:0~40亿( ) 64位:天文数字(264)

9 三、数字化原理 ——字符编码:ASCII码
字符的编码 ASCII码是美国国家标准信息交换码(American national Standard Code for Information Interchange)的简称,是目前国际上使用最广泛的字符编码。ASCII码的编码规则为: 每个字符用7位二进制数(d6d5d4d3d2d1d0)来表示,7位二进制共有128种状态(27 = 128 ),可表示128个字符,7位编码的取值范围为 ~ 。在计算机内,每个字符的ASCII码用1个字节( 8位)来存放,字节的最高位( d7)为校验位,通常用“ 0”来填充,后7位 (d6d5d4d3d2d1d0)为编码值。7位编码的ASCII码字符集包括了128个字符,称为标准的ASCII码字符集。

10 三、数字化原理 ——字符编码:ASCII码 ASCII码

11 三、数字化原理 ——字符编码:汉字编码 1、常用汉字有3000~5000个,无法用一个字节编码。
2、我国公布的《通用汉字字符集(基本集)及其交换码标准》GB 共收集了7445个字符,用两个字节编码一个字符,每个字节最高位为0。GB 编码简称国标码。 3、汉字内码是汉字在计算机内部存储、处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。内码是把国标码两个字节的最高位置“1”得到的。

12 三、数字化原理 ——颜色的编码 现实生活中的颜色是连续的、无穷无尽的,但在计算机内部,表达数据的二进制位数是有限的,因此,不可能像字符那样对颜色进行穷举,需要对颜色的连续光谱和其他和视觉有关的连续特性进行离散化。所谓离散化就是把连续量划分为离散的区段,对每一种区段都进行编码。 除受二进制位数限制外,计算机内实际颜色表示还受到硬件设备能力的限制。 颜色系统: 单色系统 彩色系统

13 三、数字化原理 ——声音的编码 声音是随时间变化的声波波形。与颜色类似,对声音波形需要进行离散化采样。声波的离散化采样是在两个维度上独立进行的。从时间维上进行时间的离散化(按一定的均匀时间间隔采样),同时,每一个采样点的高度值(声音波形的振幅)也是经过离散化,纪录为n个bit的整数编码。两者合在一起表示了声音波形的编码文件。这种记录声音的方式称为声音的波形编码。

14 三、数字化原理 ——声音的编码 采样点的时间间隔越小,就与原始波形函数越符合。声音编码中的“采样频率”,指得就是单位时间对声音波形的采样次数。采样频率用Hz(赫兹)为单位,每秒钟采样500次即为500Hz。显然,采样频率高的声音记录质量会更好一些,为此所用的存储空间也大一些。音乐CD的采样频率为44KHz。这样,为了存储一首4分钟长的歌曲,假定它是双声道,每声道2字节的采样值,一次采样需要占用32bit。这样每1秒钟的音乐就需要44100×4≈160K字节,总计需要4×60×160K≈36MB。需要的存储容量是非常大的。

15 三、数字化原理 ——声音的编码 另一种声音的编码方式—— MIDI(Musical Instrument Digital Interface,音乐设备数字接口) 一种电子乐器与电脑之间的编码协议。MIDI编码并不像波形编码那样记录乐曲每一时刻的声音采样,而是将乐曲的演奏信息,譬如使用了何种乐器,什么音符开始,什么音调结束,加以什么伴奏等记录下来。在播放时,需要通过MIDI声卡根据MIDI编码序列进行声音的合成处理,形成波形编码。这是一项高级的音响技术,需要软硬件的密切配合。一首4分钟长度的MIDI音乐纪录,其存储容量只要百余K字节。

16 三、数字化原理 ——图像的编码:点阵表示 以颜色码为基础,将原始连续信息离散化为网格点,记录每个网格点的颜色值。 2色 分辨率

17 三、数字化原理 ——图像的编码:点阵表示

18 三、数字化原理 ——图像编码:不同颜色编码的图像 不同分辨率、不同颜色编码的图像,其存储量的差别是很大的。

19 三、数字化原理 ——图像的编码:矢量表示(图形)
点阵表示法的一个重要缺点是,图片中的对象(例如,未名湖)和图片中一个个像元之间,两者的关系没有表示出来。同时,要得到高质量的图像,数据的存储量需求非常大。 与声音的MIDI编码相类似 ,假如要在一张空白图纸上勾画几个机器零件,最好是直接记录勾画这些零件形状的边界线及其相对位置。日常遇到的工程图、街区分布图、广告创意图等都是可以用线条和一些图形元素,如矩形、圆等基础元素构成的。这种编码方法称为矢量表示法,基本思想是用直线来逼近曲线,用直线段两端点位置表示直线段,而不是记录线上各点。这类方法往往只需要很少的存储量就可以表示一个图形对象。

20 三、数字化原理 ——图像编码:字符的字体与字型 字体: 字型(字形码): 每种字体,都要有相应的字型 宋体 楷体 隶书 仿宋 …
点阵:不同大小、不同分辨率 矢量 每种字体,都要有相应的字型

21 三、数字化原理 ——影像的编码 数字化电影(影像)主要是由时间上连续序列的数字化图片再加上数字化声音的合成体。影像是在时间和空间上对活动场景的离散采样。影像中的一张图片是对某一时刻场景的空间离散采样,称为影像的一帧。每秒约25帧的连续帧采样就形成影像,这是和人眼的视觉效果有关。通常一秒钟需要采样24帧左右,才能在视觉上感知为连续影像。当每秒钟采集的影像帧再减少,视觉上会有断续感,效果变差。如果多于30帧/秒,视觉基本上没有区别了,因为人眼的分辩能力有限。 影像所需要的存储空间非常大。存储10分钟的640×480的真彩色连续影像,按照每秒钟25帧计算,不包括声音信息,需要(640×480×3 byte×25帧×10分钟×60秒)个字节,大约14GB( 13824M) 字节。 与影像相比,动画通常是将矢量图形作为每一帧来存储,数据量比之影像要小很多。

22 三、数字化原理 ——基本编码规则 目标数据集合大小 C C ≤ 2k 则最小K为编码位数
(例)大写字母A, B, C, D, …, X, Y, Z共26个( ≤32 = 25) 大写字母集合  5 bit的编码集合(00000—11001) 映射规则:不多不少 , 一一对应 映射的不变量: 序(大小)保持不变

23 三、数字化原理 ——基本编码规则 编码的关键是: 离散对象类 的集合分析 键盘编码 :分析 构成文字 的基本元素集
键盘编码 :分析 构成文字 的基本元素集 大小写字母 集合大小 数字和标点符号( 可打印标点符号)集合 42 A B C D E … X Y Z a b c d e … x y z , ! “ # $ % & ‘ ( ) * / 0 ….9 : ; < = > [ \ ] ^ _ ` { | } ~ 一共包括了 94 ( ≤ 128 = 27)种不同的‘可打印’ 符号,二进制编码需要 7位。


Download ppt "   本课件为教师罗英伟参加信息学院青年教师教学基本功比赛时所作,当时获得信息学院一等奖。其内容为北京大学本科生主干必修课“计算概论”中的一节。"

Similar presentations


Ads by Google