学习数字音频的基础知识和对数字音频进行编辑操作的基本技能。 了解采样频率、量化位数、声道数等基本参数对声音质量的影响。 了解数字音频文件压缩的必要性和可能性。 学习声音编辑软件Adobe Audition 1.0。 了解MIDI作曲软件CakeWalk 9.03。
声音是极其重要的信息媒体。在多媒体应用系统中使用声音是多媒体应用最基本、最常用的手段。通过声音的应用,可以直接表达信息、制造音响效果和渲染气氛、演奏音乐以及配音解说等。
5.1数字音频基础 在计算机中,所处理的声音信号是经过离散化了的数字信号,是由一系列的数字来表示的,称为数字音频。数字音频的特点是保真度好、易于存储和分发、也易于编辑处理。数字音频信息在计算机里面以文件的形式进行保存。
5.1.1数字音频分类 数字音频从声音的组成和音响效果中可分为语音、音乐和效果声三种类型,这些数字音频在多媒体应用过程中都具有不同的特性和作用,在不同的应用环境中应该选用不同的数字音频文件。
1、语音 语音不仅是声音的载体,而且还是一种带有情感的信息媒体。只有将真实自然的解说声,通过计算机的声卡采集压缩后生成的波形声音文件才能播放出语音解说声,而利用其它软件和硬件却不能合成具有丰富感情色彩的语音解说词。因此语音信号是数字音频中一种具有特殊功能和作用的声音文件。 单击小喇叭,可以播放声音。
2、音乐 音乐是数字音频中使用最广泛、作用也较大的一种信息媒体。它具有渲染环境气氛、增强作品感染力、烘托主体的作用。在应用过程中,可以单独使用、也可以配合其它媒体一同使用。在音乐文件中,MIDI音乐文件是一种单纯的音乐文件格式,也就是说MIDI文件中只有音乐声而没有唱词声。 单击小喇叭,可以播放声音。
3、效果声 效果声简称为音效,是一种模拟自然声响的专用声音文件。它能够表达语言和音乐无法表达的信息,塑造环境氛围,起到模拟提示的作用。效果声包括各种各样的自然声响和特殊音响,它可以是自然声响,也可以是非自然的虚幻模拟声响。 鸡鸣 风铃 蛙叫 激光
5.1.2常见声音文件格式及特点 存储声音信息的文件格式有很多种,不同的文件格式具有不同的特性,在实际应用中应该了解常见的音频文件格式特点,才能在具体的应用中会做到心中有数,会有效的选择合适的文件格式。
1、MIDI文件 MIDI文件并不记录任何声音,只是记录电子乐器的弹奏信息,是乐谱的一种数字式描述方式。由于它不包含具体的声音数据,所以文件较小,便于存储和传输。一般来说,MIDI文件只适合于记录乐曲,而不能记录歌曲声音信息。
2、WAV文件 是目前一种通用的数字音频文件格式。它记录的是真实声音的波形文件。被Windows系统及其应用程序广泛支持。WAV文件支持多种音频文件格式,可以有不同的采样频率、量化位数和声道数。声音质量真实自然、音响效果好、能记录各种声音信息。不足之处是文件的数据量大,不便于存储和传输。
3、MP3文件 MP3是MPEG Audio Layer3音频文件的缩写。它是一种声音文件的压缩方法,具有音质好、压缩比高等特点。虽然它采用了有损压缩方式,但它以极小的声音失真换取了较高的压缩比,使得MP3能在Internet上广泛传播。
4、RA文件 RA的全称为RealAudio,是由Real Networks公司开发的一种流媒体文件格式,最大的特点就是可以在网络上实时传输音频信息,主要适用于网络在线播放。文件数据量小、音质好,压缩比可达到1:96。
5、WMA文件 WMA的全称是Windows Media Audio,是微软公司开发的网上流式数字音频压缩技术。WMA文件压缩比高、音质好,更加有利于网络传输。此外,还可以通过数字防伪管理方案加入防拷贝技术,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。
6、VOC文件 VOC文件是新加坡著名的多媒体公司Creative LABS开发的声音文件格式,多用于保存Creative sound blaster系列声卡所采集的声音数据,被Windows系统和Dos系统所支持。
7、AU文件 8、AIF文件 是SUN公司开发的一种音频文件格式,Unix操作系统和Java系统下的标准文件格式。 是Apple公司开发的一种音频文件格式,被Macintosh系统及其应用程序所支持。
5.2数字音频的获取 复杂的声波由许许多多具有不同振幅和频率的正弦波组成。用计算机获取音频的过程就是声音信号数字化的过程,经过数字化处理后的数字音频信息能够像文本文件和其它数字信息一样进行存储、检索、编辑和使用。
5.2.1数字音频的采集与量化 数字音频的采集和量化是计算机获取外部模拟声音信号的重要过程,也是在实际应用中能获得合适的数字音频文件的基本方法。
5.2.1.1声音的物理特性 声音的本质是物体的机械振动,通常把振动的物体称之为“声源”。声源的振动通过传播介质如空气、水进行传播,便形成了声波。人耳接受到声波后耳膜就会跟着振动,通过听觉神经末梢的传递,就可以听到声音了。
声音的波形图
声音的三个基本要素 音调 音强 音色 声音的高亢与低沉,与声波的频率有关。 声音的大小,与声波的振幅成正比。 音色是由混入基音中的泛音决定的。
声音的周期性和非周期性 凡是振动波形是周期性的、在频谱上是分列的线性谱、听起来有一定音调的,就叫做“乐音”。 凡是其振动的波形成非周期性的、在频谱上是连续的、听起来没有一定音调,但饱满生动,则叫做“噪声”。
声音信号的对比 模拟信号:是一种随时间变化的连续性的信号,传输和复制时易发生失真现象。不能被计算机处理。 数字信号:是一种离散的、非连续性的信号。在传输和复制过程中不失真,声音精度高、质量好、可用计算机方便的进行播放、存储和编辑。
5.2.1.2 采样和量化 模拟的音频信号要转换成离散的数字信号,必须对声音信号在时间和幅度两个方面进行离散化。 在横向的时间轴上,每隔一个固定的时间间隔,在声音波形曲线上抽取一个点。然后对采样点纵轴上的电压幅度用有限的数字来表示。
采样量化示意图
基本概念: 把模拟声音信号转化为数字音频时,需要在声音波形上按一定的时间间隔,获取一系列的采样点,这个过程称之为采样 。 把某一幅度范围内的电压用一个数字表示的这个过程称之为量化。 将声音数据写成计算机能处理的数据形式,以适应存储和传输的过程,称之为编码。
影响数字音频质量的因素 采样频率 量化位数 声道数
1、采样频率 采样频率(Sampling Rate)是指一秒种内采样的次数,采样频率的单位用kHz(千赫兹)表示。 采样频率越高 质量越好 数据量越大
奈奎斯特(Harry Nyquist)采样定理 采样时所采用的频率必须是模拟信号最高频率的2倍,这样才能保证采样获得的声音信号在重放时不失真,才能完全恢复原始信号的波形和质量。 如一段频率为22 kHz的声音,在采样时必须用22kHz×2=44 kHz的频率去采样。
2、量化位数 量化位数(Sampling Data)也称为“量化精度”,它是描述每个采样值的二进制数据的位数。也可以说量化就是把采样所得的值加以数字化,用计算机中的若干二进制的位数来表示的过程。 量化位数越高 质量越好 数据量越大
3、声道数 声音通道的个数称为声道数(Channels),是指一次采样所记录产生的声音波形个数。 声道数越多 声音真实感越强 数据量越大
4、数字音频的数据量 数字音频的数据量与采样频率、量化位数和声道数成正比关系。 未经压缩的数字音频的数据量可由以下公式进行计算
例题:录制30秒的单声道声音,采样频率为 44.1KHz,量化位数用16位时,所采集的不压缩的波形文件的数据量是多少兆字节。 解: 44.1×1000×16×1×30/8 =2646000(B) 2646000 1024×1024 2.52 MB 答:不压缩声音文件的数据量为2.52 MB
5.2.2数字音频的压缩与编码 声音频率的范围
CD音质 收音质量 电话质量 常见声音的采样频率和量化位数及声道数 44.1kHz,16位,立体声,172KB/秒。 采用过高和过低的采样频率,都会增加冗余的数据量或降低声音的质量,不利于数字化声音的处理和应用。
5.2.2.1音频压缩的必要性与可能性 必要性:数字化后的声音文件的数据量会非常之大,如果不进行压缩处理,一般的计算机无法对音频信号进行存储和交换。 可能性:通过除去信号中存在的大量冗余数据,和利用人的听觉特性来降低编码率。便能够达到压缩编码率的目的。
5.2.2.2音频压缩编码的基本方法 音频信号的压缩方法有多种。由于它们采用的算法复杂,音频的质量、数据的压缩比以及编解码延时等方面都有很大的不同,所以它们的具体应用也要根据使用的场合来确定。
1、波形编码 脉冲编码调制(PCM) 差分脉冲编码调制(DPCM) 自适应差分脉冲编码调制(ADPCM)
2、参数编码 把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息。对这些信息编码,最后在输出端合成原始信号。其目的是重建音频,保持原始音频的特性。参数编码的压缩率很大,但算法复杂、计算量大、保真度不高,适合于语音信号的编码。如线性预测编码(LPC)。
3、混合编码 介于波形编码和参数编码之间, 利用了这两种压缩方法的优点,以求在压缩比、压缩效率及保真度之间取得最佳折衷。如矢量和激励线性预测编码(VSELP),多子带感知编码(MPEG)等。
5.2.2.3高保真立体声音频压缩标准 MPEG音频是目前国际上比较成熟的高保真立体声音频压缩标准。MPEG音频标准提供三个独立的压缩层次,使用户可在复杂性和压缩质量之间权衡选择,即Layer1、Layer2、Layer3。 MP3采用的是MPEG标准中的第三层次的音频压缩模式。
5.2.3数字音频的获取方法 获取数字音频文件是多媒体技术的基本技能和采集获取数字信息媒体的主要方法之一。目前,常用的数字音频的获取方法主要有数字音频的采集、MIDI音乐的合成及数字音乐库的应用这三种方法。
5.2.3.1数字音频的采集 计算机、声卡、录音软件。 将输出端子插到声卡的信号输入插孔中(mic in或Line in)。 选择录音属性、设置参数和调节录音音量的大小。 打开音源,启动录音软件、开始录音、保存声音文件。
常用的声音录制软件 Windows系统自带的“录音机” Adobe Audition Sound Forge Wave Edit Gold Wave Sound Edit Pro
5.2.3.2 MIDI音乐的合成 MIDI是1983年由Yamaha、Roland等公司联合制定的一种国际标准。 MIDI软件可以创作和编辑处理MIDI文件,它可以利用有MIDI接口的电子琴或软件的虚拟钢琴及五线谱的曲目,就可以创作或合成MIDI音乐文件。 常用的MIDI制作软件有CakeWalk Pro Audio、Jammer(作曲大师)和Midi Sacn(乐谱识别)软件等。
5.2.3.3 数字音频库的应用 主要以CD音乐光盘、音效素材光盘、MIDI音乐光盘、MP3光盘、VCD和DVD光盘上以及网络数字音乐库的形式存在。 素材库中的数字音频,主要以音乐、歌曲和音响效果这三种形式存在 。
利用话筒、声卡和Windows系统自带的“录音机”程序,录制一分钟以内的一段声音文件,文件命名为“解说”,文件为WAV格式。 5.2.4 利用“录音机”采集声音文件的应用实例 利用话筒、声卡和Windows系统自带的“录音机”程序,录制一分钟以内的一段声音文件,文件命名为“解说”,文件为WAV格式。
5.3 Adobe Audition1.0应用基础 Adobe Audition1.0是Syntrillium Software公司被 Adobe公司收购后推出的音频录制、编辑软件。 Adobe Audition1.0的前身是鼎鼎有名的Cool Edit Pro 。 无论是从功能、特性,还是操作和界面方面,都和过去的 CoolEdit Pro无多大差别。也可以说Adobe Audition 1.0是 Cool Edit Pro 2.1的更新版和增强版。
5.3.1功能与窗口简介 Adobe Audition1.0的窗口主界面、窗口结构和菜单命令,与Cool Edit Pro的几乎完全相同。它的结构整齐简洁,为了方便操作和应用,除了常用的菜单选项外,还有大量的工具按钮和面板结构。它具有方便准确的录音工具和实用的面板工具,有单轨、双轨和多轨的音频窗口界面。
5.3.1.1 Adobe Audition1.0的功能 单轨录音或多轨录音 声音剪辑和编辑 数字声音的降噪和音量调整 数字声音的特效处理 从音视频文件和CD中抓取声音文件
5.3.1.2 Adobe Audition1.0应用程序界面
5.3.2声音采集编辑应用实例 Adobe Audition1.0是一个专业的声音编辑处理软件,它采集录制声音时,除了声音质量有保证以外,在录音时间和采集的音频格式方面都不受限制,录音时间的长短只受硬盘空间的限制,所生成文件的格式和种类也比较多。
利用耳麦上的话筒在Adobe Audition1.0中录制一段朗读的数字音频文件,文件以WAV格式保存。 5.3.2.1在单轨模式下采集声音 利用耳麦上的话筒在Adobe Audition1.0中录制一段朗读的数字音频文件,文件以WAV格式保存。 注意:声音文件格式应该为11025Hz、6位、单声道。 文件保存类型应选Windows PCM。
5.3.2.2在多轨模式下采集声音 利用Adobe Audition1.0可以进行多音轨的编辑,可以用来在背景音乐下,录制同步的语音解说或进行配乐朗诵的录制。一般需要两个音轨,一个音轨用于放置背景音乐,另一个音轨用来录制语音。项目文件可以保存为ses格式。
5.3.2.3音频采集应注意的问题 如果波形图是一条直线(或波形不明显),播放时将没有声音或声音很小。 电平指示窗口中,默认的动态范围为120dB,在-120dB—0dB之间。 一般情况下,录入声音时最大电平最好控制在-6dB位置。
5.3.3 声音编辑操作 声音编辑的作用就是修饰和编辑原有的声音文件,将声音文件进行剪辑、调节音量、消除噪声、添加特殊效果等操作。
5.3.3.1音频的基本编辑 选择操作对象 删除 删除非选区 复制 粘贴 混合粘贴 保存选区声音 操作中内存的释放
5.3.3.2多音轨声音编辑应用实例 多音轨声音的编辑是音频编辑技术中的一种高级编辑方法,也是专业音频制作和音乐配器制作中常用的一种编辑方法。它的操作比单轨编辑的方法要复杂,但它确有很强的实用性,比传统的声音编辑方法,具有操作简单、控制性强、灵活方便、效果显著等特点。
注意: 打开多音轨编辑窗口 选择安装目录下的“Program Files>Adobe>Audition”文件中的“Audition-Theme.ses”文件进行练习。 利用各音轨前面的“S独奏按钮”可以预览各音轨中的声音文件
5.3.3.3音频特殊效果的编辑 在音效处理方面,Adobe Audition1.0的效果器菜单下有多个子菜单,提供了多种音频特效的设置。除了通过菜单可以设置音效外,还可以直接通过窗口管理器的效果器选项卡来设置音效。
特殊音效制作练习 声音静音设置 改变音量的大小 声音淡入淡出的设置 延迟效果 降低噪音 制作环绕立体声效果
5.3.3.4系统优化 通过对选项卡中参数的设置和调整,可以对系统进行优化处理,使计算机系统更适应声音文件的编辑和处理。
5.4 MIDI音乐制作基础 MIDI是Musical Instrument Digital Interface(音乐设备数字化接口)的英文缩写。MIDI是数字音乐的国际标准,是计算机和MIDI设备之间进行信息交换的一整套规则。它是由Yamaha、Roland等几家著名的电子乐器厂商于1983年共同制定的。 MIDI本身并不能发出声音,它是一个协议。MIDI标准不仅定义了计算机音乐程序及交换音乐信号的方式,而且还规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议。
5.4.1 硬件、软件及制作系统 MIDI音乐的制作和硬件、软件有极大的关系,硬件主要指MIDI制作过程中所使用的一些声音的输出和输入设备,软件指可以支持MIDI制作的专用软件,制作系统指MIDI制作过程中的音响设备和计算机系统。
5.4.1.1制作MIDI音乐的基本设备
1、音源 音源是在音序器或音序软件的指挥下用来播放声音的设备,它可以分为硬件音源和软件音源两种形式。 硬件音源是专业MIDI制作不可缺少的设备,音源里存储着上百种的乐器音色,它是一个音乐资源库。 软件音源主要是指声卡中的波表,它可以提供128种音色,但是这种音源必须在计算机系统中才可以使用。
2、音序器 音序器又叫“编曲机”,是用于记录、编辑、播放MIDI声音信息的工具。 常用的音序器有硬件形式的,也有软件形式。 软件音序器就是MIDI作曲软件,如Cakewalk、Musicator WIN等。
3、输入设备 硬件有MIDI键盘、MIDI吹管、MIDI吉它、MIDI小提琴等 。 也可以用软件提供的虚拟键盘等工具进行演奏输入。
5.4.1.2 MIDI文件 MIDI文件中记录的是乐曲在播放时的各种音乐信息,并没有真实记录声音波形文件的具体数据。它只是一系列指令,而不是波型文件数据的集合。这些指令说明了音调、音量、通道号、力度、音符序列和合成音色的乐器等构成音乐的主要信息。MIDI文件通常比波形声音文件小得多,便于储存和携带。
MIDI文件的特点 MIDI文件是一系列指令的集合,记录相同的音频信息,MIDI文件的数据比数字波形文件小得多。 不能获得和再现自然声响,并且播放时的声音效果与合成器和声卡的质量有很密切的关系。
5.4.1.3 MIDI文件的播放 MIDI文件只是一种对乐曲的描述,本身不包含任何可以回放的声音信息,要将一首MIDI音乐通过声卡播放出来时。MIDI就需要用MIDI合成器来解释MIDI文件中的指令符号,生成所需要的声音波形,再经放大后由扬声器输出。
MIDI声音合成的方法 调频合成(FM) 波表合成(Wave Table) FM合成是通过多个频率的声音混合来模拟乐器的声音 波表合成的原理是把真实乐器的音色进行采样组成音色库,每个音色都用一个编号来表示。 使用波表技术的声卡,其音色质量主要由音色库的质量和合成器的算法所决定。
5.4.2 CakeWalk 9.03功能与窗口简介 CakeWalk是一个音序器软件,它不仅具有音乐创作功能,而且还具有极好的编辑功能。利用它可以调用各种音色、编辑各种MIDI信息,设计创作各种乐曲和打印乐谱。是MIDI音乐制作编辑最常用和最方便的一种工具软件。
5.4.2.1 CakeWalk 9.03的功能 界面友好、方便易用 。 具有多音轨MIDI与多轨音频录制和编辑的功能 。 每条音轨的各项参数均能独立调节 。 提供了FX实时音频效果器,可以给声音信号添加一些特殊效果 。 具有支持MIDI插件、支持音视频同步、可以无限次恢复和重做的功能。
5.4.2.2 CakeWalk 9.03应用程序界面 音轨窗口 事件列表窗口 五线谱窗口 钢琴卷帘窗口
5.4.3 MIDI制作应用实例 计算机中可以通过软件提供的各种MIDI输入工具制作MIDI音乐。常用的方法有利用虚拟钢琴制作MIDI音乐、利用CakeWalk软件中的钢琴卷帘窗制作MIDI音乐和利用五线谱窗口输入音符的方法来制作MIDI音乐。
5.4.3.1 CakeWalk中音符输入方法 利用虚拟钢琴输入音符 利用钢琴卷帘窗输入音符 利用五线谱窗口输入音符
1、利用虚拟钢琴输入音符
2、利用钢琴卷帘窗输入音符
3、利用五线谱窗口输入音符 五线谱编辑窗口 吉它六线谱编辑窗口
5.4.3.2使用虚拟钢琴进行MIDI制作实例 试用Cakewalk中的虚拟钢琴和以下简谱,输入音符练习制作简单的MIDI音乐。
5.4.4 MIDI编辑应用实例 利用安装目录下 ProgramFiles>Cakewalk Pro audio 9.03中的“80′s Rock.wrk”样本文件,在 CakeWalk中进行MIDI乐曲的播放、音轨的独奏、删除、复制、粘贴、量化和速度调节等操作练习。
小结 数字音频的基础知识 影响声音质量的主要因素 采集常见声音文件的标准和参数 计算不压缩声音文件的数据量 采集数字音频的方法 MIDI文件的格式和特点 用Adobe Audition 1.0采集、编辑声音 了解CakeWalk 9.03的功能和使用方法