多媒体信息编码
编码 用预先规定的方法将文字、数字或其他对象编 成数码 计算机中的所有信息都采用 “ 二进制 ” 来表示.
计算机中信息的存储单位 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 1 存储单位换算 位(比特,bit),存储信息的最小单位 0 1 0 0 0 0 0 1 位(比特,bit),存储信息的最小单位 0 1 0 0 0 0 0 1 8个位组成一个字节(Byte,缩写为B),字节是存储信息的基本单位 存储单位换算 1字节(B)=8位(bit) 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB
ASCII 英文数字等国际通用字符的编码: ASCII码(美国信息交换标准码) ASCII码采用7个二进制位来编码,在计算机中存储 时占一个字节(Byte),字节的最左位用“0”填 充
计算机中信息的表示——二进制编码 进制 组成的数字 特点 十进制 0,1,2,3,4,5,6,7,8,9 逢十进一,借一当十 二进制 0,1 逢二进一,借一当二
各种进制 十六进制的数字有:0—9,A, B, C, D, E, F 进制 二进制 十进制 十六进制 标识 B D H 例如: 1011B、 1011、 1011H。 (1011)2 、 1011、 (1011)16
二进制数转换为十进制数 例: (11010)2=? 对于任意一个二进制数a na n-1…a2a1,可以表示为一般式: an * 2n-1 + an-1 * 2n-2 +… + a2 * 21 + a1 * 20 题: (1101) 2 =(?)10
十进制整数转换为二进制数 方法: 除以2倒取余法 14=?B 余数 2 14 …… 2 7 …… 1 2 3 …… 1 2 1 …… 1 2 7 …… 1 2 3 …… 1 2 1 …… 1 所以:14=1110B
十进制与其他进制的转换 十进制转换为二进制: 短除法:除以2倒取余数 十进制转换为十六进制: 短除法:除以16倒取余数 二进制数a na n-1…a2a1转换为十进制: an * 2n-1 + an-1 * 2n-2 +… + a2 * 21 + a1 * 20 十六进制数a na n-1…a2a1转换为十进制: an * 16n-1 + an-1 * 16n-2 +… + a2 * 161 + a1 * 160
汉字编码 计算机系统B 交换码 处理码 (机内码) 字形码 汉字显示 输入码 (外码) 译码 OS的汉字服务程序 计算机系统A
汉字编码——输入码(外码) 向计算机输入汉字的两种方法: (1)自动识别方式:语音识别和文字识别 (2)将汉字编码(外码)输入 音码: 搜狗输入、紫光输入、智能输入等。 形码: 五笔、郑码等。 音形码: 形音码:
汉字编码—处理码(机内码) 处理码:计算机内部用于信息处理的汉字代码,也称汉字机内码. 常用简体汉字采用GB2312码编码,一个GB2312码占两个字节 同一个汉字可以有多种输入码(外码),但它的处理码(内码)是唯一的。
图片的数字化 位图: 由像素组成。放大后会模糊失真,占用 空间大。 矢量图: 由图元组成,通过数学公式计算获得的, 放大后不会失真,占用空间小。
位图与矢量图 矢量图 位图 文件类型 Cdr,wmf… Bmp,jpg,gif,png,psd… 优点 不会失真 文件较小 可真实地反映现实 缺点 都是计算机绘制的图形 会失真 文件较大
bmp位图存储量计算 公式: 总像素*每个像素需要的位数/8 (B)
bmp位图大小的相关因素 色彩位数相同时,像素总数越高,bmp位图图像所 需的存储空间越大。
bmp位图图像大小的计算 题1:一幅200 * 100像素的黑白位图的图像大小是多少? 题2:一幅400 * 300像素的256色位图的图像大小是多少? 题3:一幅400 * 300像素的16位色图的图像大小是多少? 200*100*1/8B 400*300*8/8B 400*300*16/8B
视频的数字化表示
视频的数字表示 视频是由一幅幅的静止图像组成的。一幅图像就叫作一帧, 因此视频就是由一帧帧静止的图像组成。 视频每秒显示的帧数因制式而异: 中国使用的PAL制:25帧/秒 欧美使用的NTSC制:30帧/秒 视频存储容量计算公式: 总的帧数×一帧的存储量 帧频*时间 一帧的总像素*每个像素所需的位数 /8(单位:B)
视频的大小计算 例:一段40秒的600*400像素的16色的视频存储空间为多少? (视频采用的是NTSC制) 总的帧数:40*30 一帧的存储量:600*400*4/8 B 视频的存储量:40*30*600*400*4/8 B =137.33MB
声音的数字化 数字化音频的过程如下图所示。 (a) 模拟音频信号 (b) 音频信号的采样 (c) 采样信号的量化
声音的数字化 通过“采样”和“量化”实现波形声音模拟量的数字化。 采样频率:每秒所采样的次数,单位为HZ(赫兹)。 量化位数:每个采样点所需的二进制位数。
声音的数字化 采样率和声音质量有关,越高声音的还原就越真 实越自然 8,000 Hz - 电话所用采样率, 对于人的说话已经足 够 22.05 KHz - FM广播的声音品质 44.1KHz - 是理论上的CD音质界限 48KHz - 人耳的极限 演示GOLDWAVE,对比采样频率变化时的声音质量变量。
声音的数字化 Wav声音文件的大小和采样频率、量化位数有关: 采样频率越高,声音越真实,存储量也越大 量化位数越大,声音越真实,存储量也越大 常识:CD的采样频率为44.1KHz。 Wav声音文件存储量的计算方法: 采样频率×时间×量化位数×声道数
在GoldWave软件中录制了一段10分钟的Wave格 式音频,状态信息如图所示: 请计算该音频的存储容量。 方法一:10*60*44100*16*2/8 B 方法二:1411*10*60/8 KB
Wav声音的处理对存储量的影响 主要判断操作有没有在时间、采样频率、量化位 数、声道数上发生改变。如果此四个因素都没变 化,wav声音文件的存储量不变。
多媒体数据压缩技术 多媒体数据中存在多种数据冗余: 空间冗余、视觉冗余、结构冗余、时间冗余。 数据能被压缩的原因在于: 首先是数据本身存在着冗余, 其次在许多情况下媒体本身允许有少量失真。
多媒体数据压缩技术 (a). 空间冗余:静态图像中存在的最主要的一种数据冗余。 同一景物表面上采样点的颜色之间往往存在着空间连贯性, 但是基于离散像素采样来表示物体颜色的方式通常没有利 用这种连贯性。例如:图像中有一片连续的区域,其像素 为相同的颜色,空间冗余产生。
(b).结构冗余:在某些场景中,存在着明显的图像 分布模式,这种分布模式称作结构。图像中重复 出现或相近的纹理结构,结构可以通过特定的过 程来生成。 例如:方格状的地板,蜂窝,砖墙,草席等图结 构上存在冗余。已知分布模式,可以通过某一过 程生成图像。
多媒体数据压缩技术 (c).视觉冗余:人类视觉系统一般的分辨能力约为26 灰度等级,而一般图像量化采用28灰度等级,这类冗 余称为视觉冗余 (d).时间冗余:序列图像中经常包含的冗余。一组连 续的画面之间往往存在着时间和空间的相关性。 例如:房间里的两个人在聊天,在这个聊天的过程中, 背景(房间和家具)一直是相同的,同时也没有移动, 而且是同样的两个人在聊天,只有动作和位置的变化。
多媒体数据压缩技术
压缩 分类:有损压缩与无损压缩 无损压缩:rar,zip 多媒体数据文件从一种格式压缩为另一种格式,通常是有 损压缩。 如:wav转成mp3,bmp转成jpg 衡量压缩技术的技术指标是: 压缩比要大 算法要简单 压缩、解压的速度要快,尽可能做到实时压缩 失真要小,解压后能尽可能恢复原数据。
视频压缩 VCD:MPEG-1 压缩标准 DVD:MPEG-2 压缩标准
课后作业 导引: 第59-61页