第4章 多媒体音频处理技术
4.1 音频技术简介 4.2 音频编码技术 4.3 音频素材的获取 4.4 音频素材的编辑
4.1 音频技术简介 4.1.1 数字音频基础 4.1.2 数字音频的采样、量化和编码 4.1.3 数字音频文件格式
4.1.1 数字音频基础 1.声音 声音是一种由机械振动产生的波,叫声波。声音的强弱体现在声波振动的幅度大小上,音调的高低体现在声波振动的频率上,人们可以使用麦克风(话筒)把声波转换成电信号,即音频信号。音频信号是一种频率范围为20Hz~20KHz的波形信号,它有两个基本的参数:频率和幅度。电压的幅度表示声音的强弱,频率表示声音的音调,它是一种在时间和幅度上都是连续的模拟信号。
4.1.1 数字音频基础 2.数字音频 模拟音频信号主要有下述几点缺点: 一、抗干扰能力差 二、噪声会累积 4.1.1 数字音频基础 2.数字音频 模拟音频信号主要有下述几点缺点: 一、抗干扰能力差 二、噪声会累积 三、无法使用计算机进行存储,不能在计算机网络中传输
4.1.1 数字音频基础 由于模拟音频信号存在上述难以克服的缺点,为了使人们能够获得更好的声音质量,更加便捷的处理方式,随着数字电子技术的发展,数字音频技术逐渐出现在音频应用的各个领域,并成为多媒体技术及应用的核心。 音频是连续变化的模拟信号,而数字音频是一个数据序列,在时间上是断续的。把模拟音频信号通过采样和量化转换成用由许多“0”、“1”表示的数字信号,这个过程就是音频的数字化。在这一处理技术中,涉及到音频的采样、量化和编码。
4.1.2 数字音频的采样、量化和编码 1.采样 模拟音频信号实际上是连续信号,或称连续时间函数x(t)。数字化时,必须先对连续信号采样,即按一定的时间间隔(T)取值, 得到x(nT)(n为整数)。T称采样周期,1/T称为采样频率, x(nT)是离散信号。 虽然数字音频信号可以克服模拟音频的缺点,但是在播放声音的时候,数字音频必须重新还原为模拟音频,为了保证还原的音频信号不失真,数字化时采样频率必须满足采样定理的要求。 采样定理:在进行模拟/数字信号的转换过程中,为保证还原后的信号不出现失真,采样频率至少是信号最高频率的2倍;采样定理又称奈奎斯特定理。 常用的音频采样率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。
4.1.2 数字音频的采样、量化和编码 2.量化 采样后的信号x(nT),其幅值仍然是连续变化的数值,为了便于在计算机中处理,必须将取样值量化成一个有限个幅度值的集合x(nT)。 量化的过程如下:量化器先将整个幅度划分成为有限个小幅度(量化间隔)的集合,把落入某个间隔内的样值归为一类,并赋予相同的量化值。量化间隔的数目,称为量化级。量化过程存在量化误差,在还原信号的D/A转换后,这种误差作为噪声再生,称为量化噪声。量化级数越多,量化误差就越小,质量就越好。增加量化级数能够把噪声降低到无法察觉的程度,但随着信号幅度的降低,量化噪声与信号之间的相关性变得更加明显。
4.1.2 数字音频的采样、量化和编码 3.编码 编码是根据一定的协议或格式把模拟信息转换成二进制比特流的过程。多媒体信息数字化的过程中,最简单的编码方式就是直接用量化后的二进制数作为输出的数字信号,这种编码方式也就是PCM(脉冲代码调制)编码。 多媒体信息的一个特点是存在各种冗余信息,具有很大的压缩潜力。因为在多媒体数据中,存在着空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余统计冗余等,它们为数据压缩技术的应用提供了可能的条件。因此,在多媒体系统中可以采用数据压缩技术对数字信号进行压缩,在保证人的主观感受不变的前提下,使得存储的数据量大大下降。采用不同的压缩技术,也即采用了不同的编码技术。
4.1.2 数字音频的采样、量化和编码 4.数字音频质量的三要素 采样频率:单时间内的采样次数。 采样的量化大小:采样的量化大小巧玲珑反映出对各个采样点进行数字化时所选用的精度。一般有8 位和16位,8位量化的精度有256个等级, 16位量化的精度有65536个等级。 采样的声道数:是单声道还是立体声。
4.1.3 数字音频文件格式 WAV文件 PCM文件 MPl、MP2、MP3文件 AIF或AIFF文件 MIDI文件 WMA文件 CD-DA文件 RA文件 MP4
4.1.3 数字音频文件格式 1.WAV文件 WAV文件也叫作波形文件,是Microsoft公司开发的一种声音文件格式,存储文件扩展名为“.wav”。WAV格式文件的数据是直接来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8~64bit)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,WAV文件所需要的存储容量很大,如果对声音质量要求不高的话,可以通过降低采样频率、采用较低的量化位数或利用单声道来录制WAV文件,此时的WAV文件大小可以大大减小。 WAV文件数据没有经过压缩,数据量大,但音质最好。大多数压缩格式的声音都是在它的基础上经过数据的重新编码来实现的,这些压缩格式的声音信号在压缩前和回放时都要使用WAV格式。
4.1.3 数字音频文件格式 2.AIF或AIFF文件 AIF是音频交换文件格式(Audio Interchange File Format)的英文缩写,是Apple公司开发的一种声音文件格式,被Macintosh平台及其应用程序所支持,Netscape Navigator浏览器中的LiveAudio也支持AIFF格式,SGI平台及其他专业音频软件包也同样支持这种格式。Windows的Convert工具可以把AIF格式的文件转换成Microsoft的WAV格式的文件。
4.1.3 数字音频文件格式 3.WMA文件 WMA就是Windows Media Audio编码后的文件格式,由微软开发,ASF和WMA都是微软公司为了和Real Networks公司竞争而开发的网上流式数字音频压缩技术,可以一边下载一边播放,因此WMA可以很轻松的实现在线广播。这种压缩技术同时兼顾了保真度和网络传输的需求, 微软声称,在只有64kbps的码率情况下,WMA可以达到接近CD的音质。WMA支持防复制功能,通过Windows Media Rights Manager 加入保护,可以限制播放时间和播放次数甚至于播放的机器等等。由于是微软的杰作,因此,微软在Windows中加入了对WMA的支持,WMA有着优秀的技术特征,在微软的大力推广下,这种格式被越来越多的人所接受。
4.1.3 数字音频文件格式 4.RA文件 RA文件是Real Networks公司开发的一种流媒体音频文件,在网络上非常流行,在低速率的广域网上实时传输音频信息。网络连接速率不同,客户端所获得的声音质量也不尽相同。对于传输速率为14.4kbit/s的网络连接,可获得调幅(AM)质量的音质;对于传输速率为28.8kbit/s的网络连接,可以达到广播级的声音质量;如果拥有ISDN或更快的线路连接,则可获得CD音质的声音。和WMA一样,RA不但都支持边下载边播放,也同样支持使用特殊协议来隐匿文件的真实网络地址,从而实现只在线播放而不提供下载的欣赏方式。这对唱片公司和唱片销售公司很重要,在各方的大力推广下,RA和WMA是目前互联网上,用于在线试听最多的音频媒体格式。
4.1.3 数字音频文件格式 5.PCM文件 PCM文件是模拟的音频信号经模数转换直接形成二进制序列的文件,该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中,可以利用VOC-HDR程序,为PCM格式的音频文件加上文件头,而形成VOC格式。Windows的Convert也具有将PCM音频文件转换成Microsoft的WAV格式的功能。
4.1.3 数字音频文件格式 6.MPl、MP2、MP3文件 MPl、MP2和MP3文件是指MPEG运动图像专家组所制定的音频文件格式,根据压缩质量和编码复杂程度的不同分为3层,分别对应MPl、MP2和MP3三种声音文件。MPEG音频文件的压缩是一种有损压缩,MPEG音频编码具有很高的压缩率,MPl、MP2的压缩率为4:1~8:1,而MP3的压缩率则高达12:1,也就是说1分钟CD音质的音乐,未经压缩需要10MB存储容量,而经过MP3压缩编码后不到1MB。MP3的特点是体积小、有较好的声音质量,所以MP3是目前最为流行的一种音乐文件。
4.1.3 数字音频文件格式 7.MIDI文件 MIDI是数字音乐电子合成乐器的统一国际标准,它规定计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方法。MIDI文件中包含音符、定时和多达16个通道的乐器定义,每个音符包括键、通道号、持续时间、音量和力度等信息,可以模拟大提琴、小提琴和钢琴等常见乐器。当播放MIDI音乐的时候,其实就是将各种预先设计好的声音元素按乐谱合成为一首音乐。MIDI的数据容量很小,适合作为音乐背景音响效果,用来播放长时间的、高质量的音乐。MIDI文件的扩展名是MID和RMI。
4.1.3 数字音频文件格式 8.CD-DA文件 CD-DA文件是CD光盘采用的文件格式,在大多数播放软件的“打开文 件类型”中,都可以看到该格式,一个CD音频文件是一个 .cda文件,这只是一个索 引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接复制.cda文件到硬盘上播放,需要使用抓音轨软件把CD格式的文件转换成WAV。
4.1.3 数字音频文件格式 9.MP4 MP4并不是MPEG-4或者MPEG-1Layer4,它的出现是针对MP3的大众化、无版权的一种保护格式。 MP4使用的是MPEG-2 AAC技术也就是俗称的a2b或AAC。其中,MPEG-2是MPEG于1994年11月针对数码电视(数码影像)提出的。它的特点就是,音质更加完美而压缩比更加大(1:15)。MPEG-2 AAC(ISO/IEC 13818-7)在采样率为8~96KHz下提供了1~48个声道可选范围的高质量音频编码。AAC就是Advanced Audio Coding(先进音频编码)的意思,适用于从比特率在8kbit/s单声道的电话音质到160kbit/s多声道的超高质量音频范围内的编码,并且允许对多媒体进行编码/解码。
4.2 音频编码技术 4.2.1 编码基础 4.2.2 编码标准
4.2.1 编码基础 音频信号数字化之后数据量巨大,为存储和传输带来了一定压力。因此,为了降低传输或存储的费用,就必须对数字音频信号进行编码压缩。 音频信息在编码技术中通常分成两类来处理,分别是语音和音乐,各自采用的技术有差异。语音编码技术又分为三类:波形编码、参数编码以及混合编码;音乐的编码技术主要有自适应变换编码(频域编码)、心理声学模型和熵编码等技术。
4.2.2 编码标准 G.7XX标准 G.711 AC-3编码 G.721 AC-3的编码 G.722 AC-3解码 G.723 DTS编码 MEPG音频 MEPG1音频内容 MPEG-2音频子系统 MPEG-4音频标准
4.3 音频素材的获取 4.3.1 从素材库直接获取或从网站下载 4.3.2 自行录制声音 4.3.3 从CD、VCD/DVD中截取声音
4.3.1 从素材库直接获取或从网站下载 用户可直接使用以上光盘或者网站上的音频素材,也可以先找到与要求相接近的声音,再通过音频编辑软件适当加以处理后使用。 图4.1 中国音乐艺术网主页
4.3.2 自行录制声音 用户可以使用多媒体计算机将来自录音、录像磁带的模拟声音转换为数字音频文件,或者通过话筒录制数字音频文件。录制声音的最简单的方法是采用Windows自带的“录音机”软件录制声音,并可以进行简单的编辑,但是“录音机”软件不适宜录制比较长的声音。如果需要录制比较长的声音,或者要对录制的声音进行高级的处理,可以使用专业的软件
4.3.2 自行录制声音 使用Windows XP中录制声音的工具“录音机”录制声音。 (1)打开录音机,录音机的主界面如图4.2所示。 4.3.2 自行录制声音 使用Windows XP中录制声音的工具“录音机”录制声音。 (1)打开录音机,录音机的主界面如图4.2所示。 图4.2 录音机的主界面
4.3.2 自行录制声音 (2)打开【文件】︱【新建】,如图4.3所示。然后单击带有红色圆形标 4.3.2 自行录制声音 (2)打开【文件】︱【新建】,如图4.3所示。然后单击带有红色圆形标 志的【录音】钮,可以开始录音,在录音时可以看到波表中绿色的 波线在跳动,录音结束后按【停止】钮结束录音。 图4.3 新建声音文件
4.3.2 自行录制声音 (3)单击【放音】钮,即可播放刚才录下的声音文件。如图4.4所示。 图4.4 播放声音文件
4.3.2 自行录制声音 (4)录音结束之后,打开【文件】︱【另存为】选项,出现如图4.5所示 4.3.2 自行录制声音 (4)录音结束之后,打开【文件】︱【另存为】选项,出现如图4.5所示 【另存为】对话框,输入声音文件取的文件名,按【保存】钮即可。 图4.5 保存声音文件
4.3.3 从CD、VCD/DVD中截取声音 获取声音除了从各种素材库中直接获取外,还可以从CD、VCD/DVD光盘中截取一段作为素材使用。目前许多媒体播放的软件均有此项功能。
4.3.3 从CD、VCD/DVD中截取声音 例:超级音频解霸的使用 (1)将需要进行转换的VCD放入光驱后,运行音频解霸,然后选 4.6所示。 图4.6 播放界面
4.3.3 从CD、VCD/DVD中截取声音 (2)单击【循环】︱【选择录取区域】按钮,此时整个播放区间 将变成阴影,这表示此时整首歌曲都可以进行录取了。同时, 【选择起始点】、【选择结束点】、【保存为MP3】等按钮也 已经变为可用。如图4.7所示。 图4.7 单击【循环/选择录取区域】按钮后
4.3.3 从CD、VCD/DVD中截取声音 (3)先将VCD好好看一遍,确定所需要录音的区域。确定所要录 音的区域也是比较简单的,先将播放进度的移动条放在所要 录音区域的开始位置,然后用鼠标单击【选择起始点】按键。 然后把播放进度的移动条放在所要录音区域的结束位置, 再用鼠标单击【选择结束点】按键。 (4)这时只要按下“播放”键,软件就会提示用户选择保存的路径, 然后超级音频解霸就会开始工作。
4.4 音频素材的编辑 4.4.1 音频卡简介 4.4.2 音频编辑处理系统简介 4.4.3 典型的音频处理软件GoldWave
4.4.1 音频卡简介 音频卡就是人们常说的声卡,在声卡出现之前,人们所能听到的计算机发出的惟一声音便是机箱上的小扬声器发出的报警声或由它发出的刺耳的低微的声音。随着现在计算机技术的飞速发展,声卡已经成为多媒体计算机不可缺少的部分,玩游戏、语音输入和打IP电话等,每一样都少不了声卡的支持。 声卡的关键技术包括数字音频、音乐合成、MIDI和音效。数字音频部分包括以44.1kHz的频率采样和以16位的分辨率录制和播放声音信号,还包括声音信号的压缩方法,一般是采用自适应脉冲码调制(ADPCM)法。音乐合成主要有FM合成法和波型表(Wave Table)合成法。
4.4.1 音频卡简介 1.声卡的分类 按照声卡与主机的接口: 分为ISA声卡、PCI声卡和USB声卡(外置) 按照声卡是否集成在主板上: 4.4.1 音频卡简介 1.声卡的分类 按照声卡与主机的接口: 分为ISA声卡、PCI声卡和USB声卡(外置) 按照声卡是否集成在主板上: 分为独立声卡与板载声卡。其中板载声卡又可以分为硬卡和软声卡。
4.4.1 音频卡简介 2.声卡的结构 (1)独立声卡 独立声卡一般由DSP、Line-In、Line-Out、MIC、Speak和游戏杆/MIDI五个接口及功率放大芯片、连接器等组成。 (2)板载声卡 随着主板集成度的提高,目前几乎所有主板上都集成了声卡,这不仅为用户节约了一笔开支,也为主板留下了更多的插槽。如果是看影碟、玩游戏,板载声卡完全能满足。
4.4.1 音频卡简介 3.声卡的主要性能指标 (1)声卡采样频率 (2)声道数目 (3)三维音效 (4)MIDI (5)FM合成
4.4.2 声音编辑处理软件系统简介 1.音频编辑处理系统的基本功能 数字音频的获取、处理和输出的过程如图4.8所示。 4.4.2 声音编辑处理软件系统简介 1.音频编辑处理系统的基本功能 数字音频的获取、处理和输出的过程如图4.8所示。 图4.8 数字音频的获取、处理和输出过程
4.4.2 声音编辑处理软件系统简介 一个完整的数字化声音处理软件应包括如下功能: 数字化声音的录制 数字化声音的编辑和回放 4.4.2 声音编辑处理软件系统简介 一个完整的数字化声音处理软件应包括如下功能: 数字化声音的录制 数字化声音的编辑和回放 数字化声音的参数修改 效果处理 非破坏式修改 WAVE格式存储
4.4.2 声音编辑处理软件系统简介 2.常见的音频编辑处理系统 Midisoft Studio 4.0 for Windows 4.4.2 声音编辑处理软件系统简介 2.常见的音频编辑处理系统 Midisoft Studio 4.0 for Windows 软件音序器(Sequencer) 声音编辑器
4.4.3 典型的音频编辑处理软件GoldWave GoldWave的主要功能 各种声音文件格式的转换 多种声源的声音录制 提供多种特殊效果 声音的剪辑
4.4.3 典型的音频编辑处理软件GoldWave 2.GoldWave主界面 运行GoldWave.exe文件启动GoldWave软件,显示其主界面,如图4.9所示。 2.GoldWave主界面 图4.9 GoldWave主界面
4.4.3 典型的音频编辑处理软件GoldWave 3.GoldWave的基本操作 打开声音文件 保存波形文件 选择波形——确定编辑区域 波形的复制、剪切、删除和载剪 波形的粘贴
4.4.3 典型的音频编辑处理软件GoldWave 4.GoldWave应用示例 制作实例1:音乐合成 方法如下: 制作实例1:音乐合成 方法如下: (1)选择“文件/打开”命令,把作为背景的声音文件(如音乐文 件)装入编辑器。 (2)选择“文件/打开”命令,把另一个需要合成的文件(如语音 文件)装入编辑器。 (3)选择“编辑/复制”命令,将整段声音复制到剪粘板中,然后 选择“文件/关闭”命令,将该文件关闭。 (4)用鼠标单击波形的某一位置,作为合成声音的起始位置,选 择“编辑/混合”命令,弹出如图4.10所示的“混音”对话框。 (5)在“混音”对话框中调整音量以确定剪贴板中声音的音量大 小,然后单击“确定”按钮退出。 (6)完成音乐合成,选择“文件/保存”命令,将其保存。
4.4.3 典型的音频编辑处理软件GoldWave 4.GoldWave应用示例 制作实例1:音乐合成 图4.10 音量调整画面
4.4.3 典型的音频编辑处理软件GoldWave 制作实例2:将CD唱盘中的一段音乐录制下来 方法如下: (1)选择“文件/新建”命令,弹出“新建声音”对话框,如图4.11 所示。 (2)在“初始化长度”文本框中输入60.000,表示声音长度为60秒, 单击“确定”按钮。 (3)将CD盘放入CD-ROM驱动器,然后选择“工具/CD播放器”命令, 使用CD播放器播放CD盘。 (4)当CD播放到想要录制的开始处时,按住Ctrl键,单击设备控制器 中的“录制”按钮。 (5)当CD播放到录制的结束点时,单击“停止录制”按钮(就是开始 录音前的“录音”按钮)或当录制时间到60秒时,GoldWave也会 自动停止录制。
4.4.3 典型的音频编辑处理软件GoldWave 图4.11 声音参数设置窗口 (6)一段CD音乐录制完毕。 (7)选择“文件/保存”命令,将其存储起来。
4.4.3 典型的音频编辑处理软件GoldWave 制作实例3:添加回声效果 方法如下: 制作实例3:添加回声效果 方法如下: (1)选择“文件/打开”命令,把原始的声音文件装入编辑器。 (2)选择“效果/回声”命令,弹出“Echo”(回音)对话框,如图 4.12所示。在对话框中设置相应的参数。其中,如果设置的延迟 时间值越大,声音持续时间越长,回声反复的次数越多,效果就 越明显。而音量控制是指返回声音的音量大小,反馈能够使声音 听上去更圆润、更具空间感。 (3)选择【文件】︱【保存】,将其制作的回声效果存储起来。
4.4.3 典型的音频编辑处理软件GoldWave 图4.12 回声对话框
本章小结: (1)音频数据的基本概念; (2)音频信息的编码技术; (3)音频卡的工作原理及主要性能指标; (4)使用几种常见的音频编辑处理系统。