Download presentation
Presentation is loading. Please wait.
1
声音素材编辑与处理
2
本章重点: 声音概述 音乐合成与MIDI 数字音频压缩标准 数字音频处理实例
3
声音在本质上是一种机械振动,它通过空气传播到人耳,刺激神经后使大脑产生一种感觉。在一些专业场合,声音通常被称为声波或音频。
4
4.1 声音概述 声音在物理学上称之为声波,是通过一定介质(如空气、水等)传播的一种连续振动的波,也称为声波。
通常把频率范围为20Hz~20kHz的信号称为音频信号。低于20Hz的信号为亚音信号或者称为次音信号;高于20kHz的信号称为超音频信号,或称为超声波信号。
7
常见声源及其频率范围:
8
声音的特征: 声音有3个重要指标即振幅、周期和频率。振幅是波的高低幅度,表示声音的强弱;周期指两个相邻波之间的时间长度;频率指每秒振动的次数,以Hz为单位。 声音的3要素是音调、音色、强度,它们分别与声波的频率、波形、振幅等相关
9
4.2 数字化音频 声音信号是时间和幅度上都连续的模拟信号。而计算机只认识“0”和“1”,或者说计算机只能处理一个个数据,尽管数据量可能是巨大的。所以,计算机处理声音的第一步是将声音数字化,将模拟信号变为数字信号。
10
4.2.1音频的数字化 把模拟声音(音频)信号转换位数字化声音(音频)的过程称为声音(音频)的数字化,或称为模/数(A/D)变换。
11
1. 采样 在音频数字化过程中,采样指的是以固定的时间间隔T对模拟信号(音频信号)进行取值。固定的时间间隔T称为采样周期,1/T称为采样频率(fs)。采样后得到的是一个离散时间信号。采样时间间隔T越短,也就是采样频率越高,声音数据在后期播放时保真度越好。
12
2. 量化 采样后的音频信号需要经过量化,使信号幅度转变为有限的离散数值。这种由有限个数值组成的信号就称为离散幅度信号。
例如,假设输入电压的范围是0V~7V,并假设它的取值只限定在0,1,2,…,7共8个值。如果采样得到的幅度值是1.2V,则它的取值就应是1V,如果采样得到的幅度值是2.6V,则它的取值就应是3V等。 这种数值就称为离散数值,即量化值。量化之后得到的是时间离散、幅度离散的数字信号。
13
3. 编码 编码,即是将量化值表示成为二进制数的形式,以便于计算机存储和处理。例如,上面量化规定的8个取值,就可以用3位二进制数表示,从000~111,2V可以表示为001,3V可以表示位011,6V可以表示位101。 计算机可以对数字化之后的音频信号进行存储、编辑和处理,并可以还原成原始的波形进行播放,这个还原的过程称为解码,它是模/数(A/D)变换的逆过程,及数/模(D/A)变换。
14
4.2.2 数字音频音质与数据量 采样频率和采样量化级数是数字化声音的两个最基本要求,直接影响数字化音频的质量和数据量。一般而言,采样频率越高声音失真越小,但用于存储音频的数据量也越大。量化位数越高音质越好,数据量越大。 通常有3中采样频率:44.1kHz(取样44 100次每秒,用于CD品质的音乐)、22.05kHz(适用于语音和中等品质的音乐)、11.025kHz(低品质),量化精度分别为8位字长(256阶)量化(低品质)和16位字长(65 535阶)量化(高品质)。
15
4.2.2 数字音频音质与数据量 反映音频数字化质量的另一个因素是通道(或声道)个数。一次采样一个声音波形,称为“单声道”;一次采样两个声音波形,称为“双声道”(即人们常说的立体声)。立体声更能反映人的听觉感受。但数据量比单声道多一倍,这样需要的存储空间是单声道的两倍。对声音的采样可以使用不同的采样频率、采样量化级数和声道,但实际上为了节省存储空间,经常要在数字化音频数据量的的大小与声音回放质量之间进行权衡。
16
声音信息数字化后的数据量计算公式为: 数据量=采样频率*量化位数*声道数/8 数据量的单位:B/s(字节/秒)
17
音质与数字音频参数的关系
18
4.2.3 数字音频文件格式 数字音频数据是以文件的形式保存在计算机中的。数字音频的文件格式主要又CD、WAVE、MP3、WMA、MIDI等。 CD文件:*.cda格式,采用44.1kHz的采样频率,速率为88kbps。具有16位量化位数,CD音轨近似无损,声音基本上终于忠于原声。 WAV文件:微软公司开发的一种声音文件格式,也称波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。
19
4.2.3 数字音频文件格式 MP3音频文件:全称为MPEG-1 audio layer3,其压缩率为12:1。优势是在高压缩比的情况下,还能拥有优美的音质。它利用知觉音频编码技术,即利用了人耳的特性,消减音乐中人耳的特性,消减音乐中人耳听不到的成分,同时尽可能地维持原来的声音质量。 WMA文件:Windows Media Audio,通过减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的。WMA的一个优点是压缩率高,,一般都在18:1.其次,WMA的内容提供商可以加入防复制保护。
20
4.2.3 数字音频文件格式 MID:Musical Instrument Digital Interface,允许数字合成器和其他设备交换数据。MIDI文件格式由MIDI继承而来。MIDI文件并不是一段录制好的声音,而是记录声音的信息,每个音符记录为一个数字,然后是告诉声卡如何再现音乐的一组指令。1分钟MIDI音乐文件的大小只有5~10KB。 Real Audio:Real network推出的一种音乐压缩格式;它的压缩比可达到96 :1 ,因此在网上比较流行。经过压缩的音乐文件可以通过速率为14.4kb/s的MODEM上网的计算机中流畅回放。
21
4.2.4 数字音频获取 声音文件的获取是为音频的编辑进行素材积累阶段。声音的获取途径很多,可以采用以下方式进行获取。 自己亲自录制
从CD唱盘获得 从网上和素材库获取
22
4.2.5 数字音频的处理 专业的音频编辑软件GoldWave功能强大,可以对音乐进行播放、录制、编辑、转换格式、特技处理等。 GoldWave支持多种声音格式,如WAV、MP3、AU、AVI、MPEG、MOV、RAW、SDS等。其主要功能有: 音频文件的格式转换:,它还支持MAC计算机所使用的声音文件。因此,通过GoldWave可以实现这种格式的转换。 音频数据的简单编辑 声音效果的处理 音频的修复 CD音乐提取 声音文件的生成 声音文件的录制
23
GoldWaved的界面与窗口 GoldWaved的界面
24
4.3 音乐合成与MIDI 音乐合成的方式根据一定的协议标准,使用音乐符号来记录和解释乐谱,并组合成相应的音乐信号,这就是MIDI(musical instrument digital interface,乐器数字接口)。 MIDI不是把音乐的波形进行数字化采样和编码,而是将数字式电子乐器的弹奏过程以命令符号的形式记录下来,如按了哪个键、力度多大、时间多长等。当需要播放出这首乐曲时,根据记录的乐谱指令,通过音乐合成器生成音乐声波,经放大后由扬声器播出。
25
1. 电子音乐中常用的术语 (1)音乐合成器(musical synthesizer)
音乐合成器是由数字信号处理器(DSP)和其他集成电路芯片构成的电子设备,用来产生并修改正弦波形,然后通过声音产生器和扬声器发出特定的声音。不同的合成器根据MIDI乐谱指令产生的音色和音质都可不同,其发声的质量和声部取决于合成器能够同时播放的独立波形的个数、控制软件的能力,以及合成器电路中的存储空间大小。
26
(2)复调(polyphony) 复调也称复音,指合成乐器同时演奏若干音符时发出的声音。如钢琴、吉他等乐器可以同时演奏几种音符,而双簧管就不能。复调着重于同时演奏的音符数,如钢琴的合弦音符。
27
(3)多音色(timbre) 多音色指同时演奏几种不同乐器时发出的声音。它着重于同时演奏的乐器数。例如,具有6音符复音的4种乐器合成器,可以同时演奏4种不同声音的6个音符,如3个钢琴的合弦音符、一个长笛、一个小提琴和一个萨克斯管的音符。要改善合成音乐的真实感,必须把许多合成器连接起来,以产生复调声音和多音色声音。
28
2. MIDI标准相关的术语 MIDI电子乐器:它是能产生特定声音的合成器,如电子键盘、吉他、萨克斯管等;它们相互间的数据传送符合MIDI的通信约定。 MIDI消息(message)或指令:MIDI软件通信协议,实际上是用数字指令描述的音乐乐谱,其中包括音符、强度、定时及乐器的指派等。 MIDI接口(interface):MIDI硬件通信协议,可使电子乐器互联或与计算机硬件端口相连,可发送和接收MIDI消息。 MIDI通道(channel):MIDI标准提供了16个通道,每种通道对应一种逻辑的合成器,即对应一种乐器的合成。 音序器:它指可用来记录、编辑和播放MIDI文件的计算机程序。
29
4.3.2 MIDI音乐的制作原理 1. MIDI音乐的产生过程
30
2. MIDI通道 当MIDI设备交流信息时,需要遵循一定的事件序列。例如,两个MIDI设备在建立连接之后首先要做的事情就是在使用相同的MIDI通道方面达成一致。MIDI可以在16个这样的通道上进行操作,这些通道用数字分别标记为0~15。只要两个MIDI设备进行交流,就必须使用相同的通道。对电脑合成音乐,每个逻辑通道可指定一种乐器,音乐键盘可设置在这16个通道之中的任何一个,而MIDI声源或者声音模块可被设置在指定的MIDI通道上接收。
31
3. MIDI接口和计算机的连接 MIDI接口由3个端口组成:输入端口(In)、输出端口(Out)和直达端口(Thru)。其中,输入端口处理接收的字节,即那些发自其他MIDI设备。 为了将两个MIDI设备连在一起,可以将其中一个的输出端口和另一个的输入端口相连,这样第一个设备就可以控制第二个设备同时发生。MIDI设备可以级联,即第一个设备的输出连接第二个设备的输入,第二个的输出再连接第三个的输入等。
32
4. MIDI音乐合成器 MIDI制造商协会制定了通用MIDI规格,简称GM规格。通用MIDI规格同时定义了GM音色库(一个音色库,也被称为音色映射,支持128种乐器声音)和GM打击音色库(只包含打击乐器发出的声音),另外还定义了其他一些与音乐相关的性能,如每个GM设备应支持的声音数量和MIDI消息种类。 MIDI合成的产生方式有两种:FM合成和波表合成。
33
4.3.3 MIDI文件的特点 用乐谱指令代替声音数据 有效记录和重现各种乐器声音 占用存储空间极小 适合乐曲创作和远距离传输
34
4.4 数字音频压缩标准 音频压缩方法是指对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或者所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。逆变换的过程,称为解压缩或解码。
35
4.4.2 数字音频压缩标准 音频信号是多媒体信息的重要组成部分。音频信号分为电话质量的语言、调幅广播质量的音频信号和高保真立体声信号。针对不同的质量标准,制定了相应的压缩标准。
36
1. 电话质量的音频压缩编码技术标准 由于数字音频压缩技术具有广阔的应用范围和良好的市场前景,因而音频压缩技术的标准化工作显得十分重要。CCITT(现ITU-T)在语音信号压缩的标准化方面做了大量的工作,制定了G.771、G.721、G.728等标准,并逐渐受到业界的认同,其他语音相关标准有:H.221、H.222、H.223、H.233、H.231、H.242、H.245、H.261、H.263等。
37
2. 调幅广播质量的音频压缩编码技术 标准 调幅广播质量音频信号的频率范围为50Hz
2. 调幅广播质量的音频压缩编码技术 标准 调幅广播质量音频信号的频率范围为50Hz ~7kHz。CCITT在1988年制定了、G.722标准。此 标准采用16kHz采样频率,14bit量化,信号数据 传输速率为224kbps,并采用子带编码方法,将 输入音频信号经滤波器分成高子带和低子带两个 部分,分别进行ADPCM编码,再混合形成输出 码。
38
3. 高保真度立体声音频压缩编码技术 标准 高保真立体声音频信号频率范围为50Hz~20kHz,采用44.1kHz采样频率,16bit量化,进行数字化转换,其数据传输速率每声道达705kbps。 一般语音信号的动态范围和频响比较小,采用8kHz采样频率,每样值用8bit表示,现在的语音压缩技术可把码率从原来的64kbps压缩到4kbps左右。但多媒体通信中的声音要比语音复杂的多,它的动态范围可达100db,频响范围可达20Hz~20kHz。因此,声音数字化后的信息量非常达。为了更有效地利用宝贵的信道资源,必须对声音进行数字压缩编码。
39
目前世界上第一个高保真立体声音频压缩标准为MPEG音频压缩算法。虽然MPEG音频标准是MPEG标准的一部分,但它也完全可以独立使用。表4-2中列出了ISO和ITU先后建议的用于电话质量的语音压缩标准。
41
4.4.3 音频压缩工具 由于存在不同格式的音频文件,在不同场合对于音频素材的格式要求也不尽相同,因此需要有专门的工具对它们进行格式转换,从而满足不同场合对音频文件的需要。 AVI MPEG WMV RM to MP3 Converter是一个好用的音频转换工具,可以将通用的视频和音频文件转换成MP3、WAV、WMA和OGG格式,支持AVI、MPEG、RM/RMVB、WMV/ASF、MOV的视频和音频格式。 对于想从视频文件中抓取音频和想把RM格式转换成MP3/WAV格式的用户来说非常有用。
42
音频压缩工具界面
43
4.5 数字音频处理实例 利用GoldWave软件录制一首自己演唱的歌曲,采样频率设为44.1kHz,生成.wav文件;并为生成的音乐文件添加混响效果,对声音进行简单的编辑与特殊处理,为音乐文件添加淡入淡出效果,最后将文件压缩成.mp3格式的文件。
44
4.5.1 利用GoldWave进行录音 1)将麦克风插入计算机声卡的麦克风插口。
2)执行“开始” →“程序” →“GoldWave”命令,打开GoldWave程序,设定录音源为“麦克风”,进行参 数适当设置。 3)在主窗口执行“文件” →“新建”菜单命令,打开“新建声音”对话框,在对话框中对参数进行设置。 4)在播放器中,单击“录音”按钮开始录音,录制过程中一条从左至右的垂直线指示录音的进程。 5)录音结束后,播放录音,录音效果满意后,执行“文 件” →“另存为”菜单命令。将声音文件保存为.wav格式,文件名称为“我的音乐”。
45
4.5.2 为音乐文件添加混响效果 1)在GoldWave窗口中,执行“文件” →“打 开”菜单命令,打开录制好的“我的音乐.wav”文件。
3)在回声对话框中,调整两次声音的延迟时间 和音量。 4)混响效果制作结束后,执行“文件” →“另 存为”命令,保存为“我的音乐2.wav”。
46
4.5.3 将文件转换为.mp3格式的文件 1)在GoldWave主窗口中执行“文件” →“打开”命令,打开调整好的“我的音乐2.wav”文件。 2)选择“文件” →“另存为”菜单命令,并在保存文件画面中,选择“MPEG音频(*.mp3)”文件类型,单击“确定”按钮。
47
谢谢
Similar presentations