多媒体信息编码
编码 用预先规定的方法将文字、数字或其他对象编 成数码 计算机中的所有信息都采用 “ 二进制 ” 来表示.
计算机中信息的存储单位 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 1 存储单位换算 位(比特,bit),存储信息的最小单位 0 1 0 0 0 0 0 1 位(比特,bit),存储信息的最小单位 0 1 0 0 0 0 0 1 8个位组成一个字节(Byte,缩写为B),字节是存储信息的基本单位 存储单位换算 1字节(B)=8位(bit) 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB
ASCII 英文数字等国际通用字符的编码: ASCII码(美国信息交换标准码) ASCII码采用7个二进制位来编码,在计算机中存储 时占一个字节(Byte),每个字节的左边的第一 位为0。
请记住A、a、0三个字符的ASCII码值
计算机中信息的表示——二进制编码 进制 组成的数字 特点 十进制 0,1,2,3,4,5,6,7,8,9 逢十进一,借一当十 二进制 0,1 逢二进一,借一当二
各种进制 十六进制的数字有:0—9,A, B, C, D, E, F 进制 二进制 十进制 十六进制 标识 B D H 例如: 1011B、 1011、 1011H。 (1011)2 、 1011、 (1011)16
二进制数转换为十进制数 例: (11010)2=? 对于任意一个二进制数a na n-1…a2a1,可以表示为一般式: an * 2n-1 + an-1 * 2n-2 +… + a2 * 21 + a1 * 20 题: (1101) 2 =(?)10
十进制整数转换为二进制数 方法: 除以2倒取余法 14=?B 余数 2 14 …… 2 7 …… 1 2 3 …… 1 2 1 …… 1 2 7 …… 1 2 3 …… 1 2 1 …… 1 所以:14=1110B
十进制与其他进制的转换 十进制转换为二进制: 短除法:除以2倒取余数 十进制转换为十六进制: 短除法:除以16倒取余数 二进制数a na n-1…a2a1转换为十进制: an * 2n-1 + an-1 * 2n-2 +… + a2 * 21 + a1 * 20 十六进制数a na n-1…a2a1转换为十进制: an * 16n-1 + an-1 * 16n-2 +… + a2 * 161 + a1 * 160
二进制整数转换为十六进制 从右边开始每4位为一组划分,并将每组的4位二 进制转换为1位十六进制数字。 例: (110110110)2=(?)16 1 B 6 所以:110110110B=1B6H
十六进制转换为二进制 1A2H =110100010B 每1位十六进制数转换成4位二进制数,不足四位 的用0填充高位以足4位。
汉字编码 计算机系统B 计算机系统A 交换码 GB2312,也称国标码 处理码 (机内码) 字形码 汉字显示 输入码 (外码) 译码 OS的汉字服务程序 计算机系统A GB2312码每个字节+80H得到机内码
汉字编码——输入码(外码) 向计算机输入汉字的两种方法: (1)自动识别方式:语音识别和文字识别 (2)输入码(外码)输入: 音码: 搜狗输入、紫光输入、智能输入等。 形码: 五笔、郑码等。 音形码: 形音码:
GB2312国标码(交换码) GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,中 国大陆、新加坡等地采用此编码。 基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成 94个区,每区有94个位。每个区位上只有一个字符,因此可用所在 的区和位来对汉字进行编码,称为区位码。 把换算成十六进制的区位码加上2020H,就得到国标码GB2312。 国标码加上8080H,就得到常用的计算机机内码。 对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致 了后来GBK及GB 18030汉字字符集的出现。
汉字编码—处理码(机内码) 处理码:计算机内部用于信息处理的汉字代码,也称汉字机内码. 同一个汉字可以有多种输入码(外码),但它的处理码(机内码)是唯一的,一个常用简体汉字的处理码占2B
图片的数字化 位图: 由像素组成。放大后会模糊失真,占用 空间大。 矢量图: 由图元组成,通过数学公式计算获得的, 放大后不会失真,占用空间小。
位图与矢量图 矢量图 位图 文件类型 Cdr,wmf… Bmp,jpg,gif,png,psd… 优点 不会失真 文件较小 可真实地反映现实 缺点 都是计算机绘制的图形 会失真 文件较大
bmp位图存储量计算 公式: 总像素*每个像素需要的位数/8 (B)
bmp位图大小的相关因素 色彩位数相同时,像素总数越高,bmp位图图像所 需的存储空间越大。
bmp位图图像大小的计算 题1:一幅200 * 100像素的黑白位图的图像大小是多少? 题2:一幅400 * 300像素的256色位图的图像大小是多少? 题3:一幅400 * 300像素的16位色图的图像大小是多少? 200*100*1/8B 400*300*8/8B 400*300*16/8B
视频的数字化表示
视频的数字表示 视频是由一幅幅的静止图像组成的。一幅图像就叫作一帧, 因此视频就是由一帧帧静止的图像组成。 视频每秒显示的帧数因制式而异: 中国使用的PAL制:25帧/秒 欧美使用的NTSC制:30帧/秒 视频存储容量计算公式: 总的帧数×一帧的存储量 帧频*时间 一帧的总像素*每个像素所需的位数 /8(单位:B)
视频的大小计算 例:一段40秒的600*400像素的16色的视频存储空间为多少? (视频采用的是NTSC制) 总的帧数:40*30 一帧的存储量:600*400*4/8 B 视频的存储量:40*30*600*400*4/8 B =137.33MB
声音的数字化 数字化音频的过程如下图所示。 (a) 模拟音频信号 (b) 音频信号的采样 (c) 采样信号的量化
声音的数字化 通过“采样”和“量化”实现波形声音模拟量的数字化。 采样频率:每秒所采样的次数,单位为HZ(赫兹)。 量化位数:每个采样点所需的二进制位数。
声音的数字化 采样率和声音质量有关,越高声音的还原就越真 实越自然 8,000 Hz - 电话所用采样率, 对于人的说话已经足 够 22.05 KHz - FM广播的声音品质 44.1KHz - 是理论上的CD音质界限 48KHz - 人耳的极限 演示GOLDWAVE,对比采样频率变化时的声音质量变量。
声音的数字化 Wav声音文件的大小和采样频率、量化位数有关: 采样频率越高,声音越真实,存储量也越大 量化位数越大,声音越真实,存储量也越大 常识:CD的采样频率为44.1KHz。 Wav声音文件存储量的计算方法: 采样频率×时间×量化位数×声道数
在GoldWave软件中录制了一段10分钟的Wave格 式音频,状态信息如图所示: 请计算该音频的存储容量。 方法一:10*60*44100*16*2/8 B 方法二:1411*10*60/8 KB 请记住:1分钟,16bit,双声道,44.1KHZ的wav音频容量约为10.1MB
Wav声音的处理对存储量的影响 主要判断操作有没有在时间、采样频率、量化位 数、声道数上发生改变。如果此四个因素都没变 化,wav声音文件的存储量不变。
Goldwave处理声音对文件容量的影响 选中的声道数 Goldwave处理声音 是否影响文件存储量 无论选中几个声道 设置静音、更改音量、设置淡入淡出 N 其它参数保持不变的情况下存储文件 插入静音 Y 选中部分声道 剪裁、删除、剪切 选中所有声道 插入静音将插在选中音频的前面。
多媒体数据压缩技术 多媒体数据中存在多种数据冗余: 空间冗余、视觉冗余、结构冗余、时间冗余。 数据能被压缩的原因在于: 首先是数据本身存在着冗余, 其次在许多情况下媒体本身允许有少量失真。
多媒体数据压缩技术 (a). 空间冗余:在同一幅图像中,规则物体和规则背景的 表面物理特性具有相关性,这些相关性的光成像结构在数 字化图像中表现为空间冗余。 例如:图像中有一片连续的区域,其像素为相同的颜色, 空间冗余产生。
(b).结构冗余:在某些场景中,存在着明显的图像 分布模式,这种分布模式称作结构。图像中重复 出现或相近的纹理结构,结构可以通过特定的过 程来生成。 例如:方格状的地板,蜂窝,砖墙,草席等图结 构上存在冗余。已知分布模式,可以通过某一过 程生成图像。
多媒体数据压缩技术 (c).视觉冗余:人类视觉系统一般的分辨能力约为26 灰度等级,而一般图像量化采用28灰度等级,这类冗 余称为视觉冗余 (d).时间冗余:图像序列中的两幅相邻的图像,后一 幅图像与前一幅图像之间有较大的相关性,这表现为 时间冗余。 例如:在语音中,由于人在说话时发音的音频是一连 续的渐变过程,也是一种时间冗余。
多媒体数据压缩技术
压缩 分类:有损压缩与无损压缩 无损压缩:rar,zip 多媒体数据文件从一种格式压缩为另一种格式,通常是有 损压缩。 衡量压缩技术的技术指标是: 压缩比要大 算法要简单 压缩、解压的速度要快,尽可能做到实时压缩 失真要小,解压后能尽可能恢复原数据 性质 无压缩格式 有损压缩格式 图片 bmp jpg , gif ,png 音频 wav mp3 , wma 视频 Avi(可以无压缩) Mpg ,mp4 ,wmv , flv , avi(也可以是压缩格式) 压缩比=原文件大小/压缩文件大小
视频压缩 VCD:MPEG-1 压缩标准 DVD:MPEG-2 压缩标准