Download presentation
Presentation is loading. Please wait.
1
第二章 音频信息的获取与处理
2
考核目的: 考核学生对数字音频获取与处理的基本原理、采样量化的基本原理、音频卡的组成及工作原理、音频编码标准以及音乐合成原理的理解和掌握。
3
考核的知识点: 什么是数字音频、数字音频采样和量化的基本原理、音频卡的工作原理、音频编码标准和音乐合成的原理。
4
考核要求: 掌握:数字音频信息的获取与处理的原理过程、音频卡的工作原理。 理解:数字音频采样量化的原理过程、音乐合成的原理。 了解:数字音频编码的标准。
5
2-1 数字音频:在计算机内,所有的信息均以数字表示。各种命令是不同的数字,各种幅度的物理量也是不同的数字。音频信号也用一系列数字表示,称之为数字音频。数字音频的特点是保真度好,动态范围大。(教材P17)
6
2-2 采样:模拟声音在时间上是连续的,而数字音频是一个数字序列,在时间上只能是断续的。因此当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值,称之为采样,采样的时间间隔称为采样周期。(教材P18)
7
2-3 量化:在数字音频技术中,把采样得到的表示声音强弱的模拟电压用数字表示。模拟电压的幅值仍然是连续的,而用数字表示音频幅度时,只能把无穷多个电压幅度用有限个数字表示,即把某一幅度范围内的电压用一个数字表示,这称之为量化。(教材P18)
8
2-4.常用的音频采样率有:8kHz、11. 025kHz、22. 05kHz、16kHz、37. 8kHz、44
2-4.常用的音频采样率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。(教材P18)
9
2-5 数字音频的文件格式(教材P21) .WAV Microsoft公司的波形音频文件格式。 .MID MIDI文件格式。 .VOC Creative公司的波形音频文件格式。 .SND NeXT计算机的波形音频文件格式。 .AIF Apple计算机的波形音频文件格式。 .RMI Microsoft公司的MIDI文件格式。它可以包括图片、标记和文本。
10
2-6 WAV文件储存容量计算(教材P19) WAV文件的字节数/每秒=采样频率(Hz)×量化位数(位) ×声道数/8
11
2-7 MIDI文件(教材P20) 由于MIDI文件记录的是一系列的计算指令而不是数据化后的波形数据,因此占用的存储空间比WAV文件要小很多。所以预装MIDI文件比装入WAV文件要容易很多。这为设计多媒体应用系统和指何时播放音乐带来很大的灵活性。但是MIDI文件的录制比较复杂,这要学习一些使用MIDI创作并改编作品的专业知识,并且还必须有专门工具,如键盘合成器等。
12
2-8 音频信号处理的特点(教材P20-21) (1) 音频信号是时间依赖的连续媒体。 (2) 理想的合成声音应是立体声。 (3) 对语音信号的处理,要抽取语意等其它信息,如可能会涉及到语言学、社会学、声学等。
13
2-9 从人与计算机交互的角度来看音频信号相应的处理(教材P21)
(1) 人与计算机通信 音频获取;语音识别与理解。 (2) 计算机与人通信 音频合成; 声音定位;音频/视频同步。 (3) 人—计算机—人通信
14
2-10 音频卡的主要功能(教材P21) 音频的录制与播放、编辑与合成、MIDI接口、文语转换、CD-ROM接口及游戏接口等。
15
2-11 音频卡的分类(教材P23) 音频卡的分类主要根据数据采样量化的位数来分,通常分为8位、16位和32位等几类。位数越高,量化精度越高,音质就越好。
16
2-12 音频卡的工作原理(教材P24-25) (1)声音的合成与处理:这部分是音频卡的核心,一般由数字声音处理器、FM音乐合成器及MIDI控制器组成。 它的主要任务是完成声波信号的 模/数、数/模转换,利用调频技术控制声音的音调、音色、和幅度。
17
(2)混合信号处理器及功率放大器:内置数字/模拟混音器,混音器的声源可以是MIDI信号、CD音频、线输入、话筒和PC的扬声器等,可以选择输入一个声源或将几个不同的声源进行混合录音。
(3)计算机总线接口和控制器:总线接口和控制器是由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑及DMA(直接存储器存取)控制逻辑组成。
18
2-13音频卡硬件的安装步骤(教材P26) (1)将电脑电源关闭,拔下供电电源和所有外接线插头; (2)打开机箱外壳,选择一个空闲的16位扩展槽并将声卡插入扩展槽,声卡一般应尽可能远离显示卡,以防两者互相干扰; (3)连接来自CD-ROM驱动器的音频线及声卡的输入/输出线和游戏棒等; (4)如果需要,将CD-ROM驱动器的接口电缆插在卡上相应的接口上,并将CD-ROM的音频输出线接到声卡的针形输入线上; (5)连接诸如麦克风、外部音源和游戏棒等其它设备; (6)盖上机箱外壳,并将电源插头插回,待全部调试通过后再将固定螺丝拧紧。
19
2-14 从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。根据统计分析结果,语音信号存在着多种冗余度,其最主要部分可以分别从时域和频域来考虑。另外由于语音主要是给人听的,所以考虑了人的听觉机理,也能对语音信号实行压缩。 (教材P28)
20
2-15 音频编码的分类(教材P30) (1)基于音频数据的统计特性进行编码,其典型技术是波形编码。 (2)基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原音频的特性。 (3)基于人的听觉特性进行编码:从人的听觉系统出发,利用掩蔽效应,设计心理声学模型,从而实现更高效率的数字音频的压缩。其中以MPEG标准中的高频编码和Doldy AC-3最有影响。
21
音频编码的分类如下: 1) 基于音频数据的统计特性进行编码 典型技术是波形编码: PCM: DPCM ADPCM 2)基于音频的声学参数,进行参数编码 3)基于人的听觉特性进行编码
22
2-16 音频编码算法和标准(教材P31-36) (1)G.711 、G.721 、G.722 、G.728 (2)5、MPEG中的音频编码 (3)AC-3编码和解码
23
2-17 AC-3编码和解码(教材P36-39)
24
AC-3可编程解码器 (P37) AC-3编码器框图 (P37) AC-3 编码流程图 (P38) 同步帧结构图 (P39) AC-3解码器框图 (P40)
25
2-18 一个乐音,包括必备的三要素:音高、音色和响度。若把一个乐音放在运动的旋律中,它还应具备时值—持续时间。这些要素的理想配合是产生优美动听的旋律的必要条件。(教材P40)
26
音高:音高指声波的基频。基频越低,给人的 感觉越低沉。音阶与频率的对应关系 (P41)
音色:声音的音质。由声音的频谱决定的:各阶谐波的比例不同,随时间衰减的程度不同,音色就不同。 响度:响度是对声音强度的衡量,它是听判乐音的基础。
27
音乐合成技术的种类 调频(FM)音乐合成技术 FM是使高频震荡波的频率按调制信号规律变化的一种调制方式。 音乐系统框图 (P42)
28
波形表(Wavetable)音乐合成技术
乐器发出的声音进行采样后,将数字音频信号存储在ROM芯片或硬盘中,进行合成时将再将相应乐器的波形记录播放出来,即波形表音乐合成技术。
29
什么时候使用MIDI? 长时间高质量音乐 以音乐做背景音响效果,同时从CD—ROM中装载其他数据 以音乐做背景音响效果,同时播放波形音频或实现文语转换,以实现音乐和语音同时输出。
30
2-19 MIDI规范(教材P42) MIDI(Musical Instrument Digital Interface)是乐器数字接口的缩写,泛指数字音乐的国际标准。MIDI标准规定了不同厂家的电子乐器与计算机连接的电缆和硬件。它还指定从一个装置传送数据到另一个装置的通信协议。这样,任何电子乐器,只要有处理MIDI信息的处理器和适当的硬件接口都能变成MIDI装置。MIDI间靠这个接口传递消息而进行彼此通信。
Similar presentations