声音信号数字化 信息工程学院 宋 荣 杰
导入
内容大纲 认识声音 声音信号的数字化 声音数字化硬件实现 数字音频技术指标 01 02 03 04 模板来自于 http://meihua.docer.com/ 数字音频技术指标 04
01 认识声音 声音是什么 如何描述声音 模板来自于 http://meihua.docer.com/
1.1 声音的产生 声音是由物体振动产生的。 我们知道,声音……
小实验-敲击音叉 声音具有音色、音调、响度三要素,从物理学角度来看,声波的特点有波形、频率、和振幅
1.2 声音的特征 波形 是物体的结构、材料决定的,与音色有关。
1.2 声音的特征 波形 振幅 是波形距平衡位置的位移,与声音的强弱相关。 振幅大 振幅小
1.2 声音的特征 物体每秒振动的次数,决定音调高低。 人耳能听到的声音频率范围: 20Hz—20kHz 波形 振幅 频率 频率低 频率高 次声波 音频 超声波 < 20 Hz 20 ~ 20,000 Hz > 20,000 Hz
1.2 声音的特征 波形 振幅 频率 纯音 复合音
02 声音信号数字化 模拟信号和数字信号 声音信号数字化过程 电信号 话筒 声音 模板来自于 http://meihua.docer.com/
2.1 模拟信号和数字信号 在时间和振幅上都是连续的信号称为模拟信号。 在时间和振幅上都是离散的信号称为数字信号。 t a) 模拟信号 t b) 数字信号 在时间和振幅上都是连续的信号称为模拟信号。 在时间和振幅上都是离散的信号称为数字信号。 计算机中的数据是以0、1二进制形式存储的,是数字信号。
2.2 声音信号数字化 把模拟声音转换成数字声音的过程称为声音的数字化。 数字化有利于声音在计算机中的保存、编辑、合成等处理。 模拟信号 010110100 1111101011 保存到 模拟信号 把模拟声音转换成数字声音的过程称为声音的数字化。 数字化有利于声音在计算机中的保存、编辑、合成等处理。
2.2 声音信号数字化 模拟信号 数字信号 1 2 编码 3 采样 量化
Step1 采样 2.2 声音信号数字化 每隔一定的时间从模拟信号中取一个样本。 采样频率:每秒采集的样本个数。单位:Hz 1秒 y t t1 △ T t2 1秒 采样频率:每秒采集的样本个数。单位:Hz
采样频率 存储量增大 信号失真 采样频率增大 采样频率降低 声卡的采样频率有 44.1.22.05,11.025三个工业标准,高于48Khz人耳已无法分辨。 信号失真 存储量增大
采样定理(尼奎斯特定理): 如果采样频率不低于原始信号中最高频率分量的两倍,采样信号就能唯一完整的恢复出原始信号。 Shannon 1916-2001 Nyquist 1889-1976 分量s2: f2 分量s1: f1 复合音S 采样频率:>2f2
采样定理(尼奎斯特定理): 如果采样频率不低于原始信号中最高频率分量的两倍,采样信号就能唯一完整的恢复出原始信号。 Shannon 1916-2001 Nyquist 1889-1976 人耳听到的音频:20-20kHz 如果采样频率为2×20kHz即40kHz?
采样定理(尼奎斯特定理): 如果采样频率不低于原始信号中最高频率分量的两倍,采样信号就能唯一完整的恢复出原始信号。 Shannon 1916-2001 Nyquist 1889-1976 11.025kHz 22.05kHz 电话音质 广播音质 44.1kHz CD音质 工业上常用的三个采样频率
Step2 量化 Step2 量化 Step2 量化 2.2 声音信号数字化 将样本的振幅进行等级划分,实现振幅离散化。量化等级通常为2的整数次幂。 y y=f(t1) s1 t t1
2.2 声音信号数字化 将每一个样本的振幅进行等级划分,实现振幅离散化。量化等级通常为2的整数次幂。 Step2 量化 量化值:6 3 1 2 6 4 5 7 s1 量化值:5 s2 量化值:1 s3 量化值:5 6 5 3 1 0 1 3 5 6 5 3 1 0 1 3
2.2 声音信号数字化 将每一个样本的振幅进行等级划分,实现振幅离散化。量化等级通常为2的整数次幂。 Step2 量化 量化值:6 3 1 2 6 4 5 7 s1 量化值:5 s2 量化值:1 s3 量化值:5 6 5 3 1 0 1 3 5 6 5 3 1 0 1 3
2.2 声音信号数字化 将每一个样本的振幅进行等级划分,实现振幅离散化。量化等级通常为2的整数次幂。 Step2 量化 s1
s1 s2 5 6 5 3 1 0 1 3 量化等级增多 量化等级减少 s1 s2 s1 s2 3 3 3 2 1 0 1 2… 10 12 10 6 2 0 2 6
Step3 编码 2.2 声音信号数字化 101 110 101…… 确定样本的表示形式及编码位数。 111 7 量化值: 110 6 5 6 5 3 1 0 1 3 等级 7 6 5 4 3 2 1 编码 111 110 101 100 011 010 001 000 3个二进制位 8=23 编码: 101 110 101……
2.2 声音信号数字化 Step3 编码 确定一个样本的二进制位数及表示形式,二进制位数也叫量化位数、量化精度。 等级 15 14 13 12 …… 2 1 编码 1111 1110 1101 1100 …… 0010 0001 0000 量化结果: 10 12 10 6 2 0 2 6 二进制编码: 1010 1100 ……
样本个数相同,数据量由24bit增加到32bit 量化等级8 量化等级16 s1 s2 s1 s2 量化值: 5 6 5 3 1 0 1 3 10 12 10 6 2 0 2 6 量化位数是3位 量化位数4位 101 110 101 011 001 000 001 011 1010 1100 1010 0110 0010 0000 0010 0110 编 码: 样本个数相同,数据量由24bit增加到32bit
量化等级少,编码时二进制位数少,数据量小。 量化等级多,编码时二进制位数多,数据量大。 目前,常用的量化位数有8位,16位,32位等。 量化等级8 量化等级16 量化等级少,编码时二进制位数少,数据量小。 量化等级多,编码时二进制位数多,数据量大。 目前,常用的量化位数有8位,16位,32位等。 216=65536个量化等级 每个样本需要用16bit s1 s2 s1 s2 量化值: 5 6 5 3 1 0 1 3 10 12 10 6 2 0 2 6 量化位数是3位 量化位数4位 101 110 101 011 001 000 001 011 1010 1100 1010 0110 0010 0000 0010 0110 编 码: 样本个数相同,数据量由24bit增加到32bit
2.2 声音信号数字化 采样 量化 编码 101 110 101 011 001 000 001 011 …… 模拟信号 数字信号
03 声音数字化硬件实现 数字化硬件实现 数字声音的播放 模板来自于 http://meihua.docer.com/
3 声音数字化硬件实现 录音 话筒 模拟信号 数字音频 模-数转换 数字音频 数-模转换 模拟信号 声卡 扬声器
04 数字音频技术指标 音质 数据率 文件大小 模板来自于 http://meihua.docer.com/
模板来自于 http://meihua.docer.com/
声道数量通常为1或2,即单声道或双声道(立体声)。双声道数字化时数据量增加1倍。 音质 模板来自于 http://meihua.docer.com/ 音质与采样频率、量化位数和声道数有关。 声道数量通常为1或2,即单声道或双声道(立体声)。双声道数字化时数据量增加1倍。
文件大小=数据率(bps)×时间(s) 数据率=采样频率×量化位数×声道数 模板来自于 http://meihua.docer.com/ 数据率是每秒钟的数据量大小,单位:位/秒(bps)或千位/秒(kbps) 。 例如:WAV声音文件一般采用44.1kHz的采样频率、16位的量化位数和立体声(双声道)存储声音,则其数据率为: 44100×16×2=1411200bps=1411.2kbps 例如:1分钟WAV文件的大小=1411.2(kbps)×60(s) ≈ 10.1MB
同一音频可以通过编码技术存储为不同的文件格式。 模板来自于 http://meihua.docer.com/ Wav文件存储的是二进制采样数据,文件体积较大。 Mp3文件通过有损压缩编码使得文件大小仅为Wav文件的1/10。 flac文件通过无损压缩编码使文件大小比Wav文件小,同时保持了声音质量。
小结 声音特征 声音的数字化过程 声音数字化硬件实现 数字音频的技术指标 音质/数据率/文件大小 声波 模拟电信号 时间离散 振幅离散 数字信号 传声器 采样 编码 量化 声音数字化硬件实现 数字音频的技术指标 音质/数据率/文件大小
思考 采样间隔和量化间隔可否不同? 图像、视频如何数字化?