多媒体技术及应用 2017年9月9日星期六第二章多媒体音频技术第二章多媒体音频技术.

多媒体技术及应用 2017年9月9日星期六第二章多媒体音频技术第二章多媒体音频技术

2.1 数字音频基础一、声音的基本概念声音是通过一定介质传播的一种连续波。声波重要指标振幅：音量的大小周期：重复出现的时间间隔
t 振幅周期 A 重要指标振幅：音量的大小周期：重复出现的时间间隔频率：指信号每秒钟变化的次数

2.1 数字音频基础声音按频率分类：人类说话声音频率范围：300Hz-3kHz 声音质量的频率范围：频带次声波可听声波超声波
多媒体技术及应用 2017年9月9日星期六 2.1 数字音频基础声音按频率分类：次声波可听声波超声波 20Hz 20kHz f(Hz) 人类说话声音频率范围：300Hz-3kHz 声音质量的频率范围： k 7k 15k 20k CD-DA FM广播 AM广播电话 f(Hz) 频带第二章多媒体音频技术

2.1 数字音频基础二、声音的数字化 1.声音信号的类型模拟信号(自然界、物理) 数字信号(计算机) 2.声音数字化过程模拟信号
采样量化编码模拟信号数字信号模拟信号数字信号 A/D ADC D/A DAC

2.1 数字音频基础 3.声音数字化过程图示连续的模拟声音信号声音信号的采样离散的音频信号顺序

2.1 数字音频基础 4.声音数字化三要素采样频率量化位数声道数每秒钟抽取声波幅度样本的次数每个采样点用多少二进制位表示数据范围
使用声音通道的个数采样频率越高声音质量越好数据量也越大量化位数越多音质越好立体声比单声道的表现力丰富，但数据量翻倍 11.025kHz 22.05 kHz 44.1 kHz 8位＝256 个值 16位＝65536个值单声道立体声

2.1 数字音频基础 5.声音数字化计算公式数据量＝采样频率×量化位数 ×声道数/8(字节/秒) 采样频率 (kHz) 量化位数
数据量＝采样频率×量化位数 ×声道数/8(字节/秒) 采样频率 (kHz) 量化位数 (bit) 数据量(KB/s) 单声道立体声 11.025 8 10.77 21.53 16 43.07 22.05 86.13 44.1 172.27

2.1 数字音频基础三、数字音频的文件格式 1.WAV文件
WAV是Microsoft/IBM共同开发的PC波形文件。因未经压缩，文件数据量很大。特点：声音层次丰富，还原音质好 2.MP3文件 MP3(MPEG Audio layer 3)是一种按MPEG标准的音频压缩技术制作的音频文件。特点：高压缩比(11:1)，优美音质

2.1 数字音频基础 3.WMA文件 WMA(Windows Media Audio)是Windows Media格式中的一个子集(音频格式)。特点：压缩到MP3一半 4.MIDI文件 MIDI(乐器数字接口)是由一组声音或乐器符号的集合。特点：数据量很小，缺乏重现自然音

压缩编码是用某种方法使数字化信息的编码率减低
2.2 数字音频压缩标准一、音频压缩方法概述编码器传输/存储解码器输入音频信号输出音频信号压缩编码是用某种方法使数字化信息的编码率减低 ①声音信号中存在大量的冗余度 ②听觉具有强音能抑制弱音现象音频压缩依据无损压缩：霍夫曼编码、算术编码、行程编码有损压缩：波形编码、参数编码、混合编码

2.2 数字音频压缩标准二、音频压缩技术标准分类标准说明电话语音质量 G.711 采样8kHz，量化8bit，码率64kbps
采用ADPCM编码，码率32kbps G.723 采用ADPCM有损压缩，码率24kbps G.728 采用LD-CELP压缩技术，码率16kbps 调幅广播质量 G.722 采样16kHz，量化14bit，码率224(64)kbps 高保真立体声 MPEG 音频采样44.1kHz，量化16bit，码率705kbps (MPEG三个压缩层次，384-64kbps)

2.2 数字音频压缩标准三、音频压缩工具 MP3压缩工具(豪杰超级解霸3000)

2.3 声卡与音箱一、声卡(又称声音卡、音频卡) 1.声卡的主要功能声卡是负责录音、播音和声音合成的一种多媒体板卡。
①录制、编辑和回放数字音频文件 ②控制和混合各声源的音量 ③记录和回放音频时进行压缩和解压缩 ④语音合成技术(朗读文本) ⑤具有MIDI接口(乐器数字接口)

2.3 声卡与音箱 2.声卡的组成原理总线接口芯片数字音频处理芯片音乐合成器 A/D和D/A 混音器话筒输入扬声器输出线性输入
线性输出总线接口芯片数字音频处理芯片音乐合成器 A/D和D/A MIDI接口混音器 CD接口计算机总线话筒输入线性输入扬声器输出

2.3 声卡与音箱 3.声卡的性能指标 ⑴采样和量化能力衡量音响器材音质好坏。采样频率：11.025kHz (语音效果)
量化等级： 8位/256级 (语音质量) 16位/65536级(高保真质量)

2.3 声卡与音箱 ⑵芯片类型 CODEC芯片(依赖CPU，价格便宜) 数字信号处理器DSP(不依赖CPU) ⑶总线类型
ISA总线、PCI总线、USB接口 ⑷输出声道数 2声道(立体声)、2.1/4.1/5.1声道多通道声卡(营造杜比环绕立体声)

2.3 声卡与音箱 4.声卡的外部接口

2.3 声卡与音箱二、音箱音箱是一种电声转换的发音设备，它由箱体、扬声器、电源和信号放大器等组成。分类：2.0→双声道立体声
2.1/4.1/5.1/7.1 5.1→五声道＋超重低音声道

2.3 声卡与音箱杜比环绕立体声技术

2.4 音频处理软件专业音乐软件音乐编曲软件 (音序器) 合成器软件 Cakewalk 1.0-9.0→Sonar 1.0-3.0
Cubase VSI 5.x→Cubase SX 2.1 (MIDI/音频/合成器一体化) Logic Audio、Vegas Audio/Video等录音、混音、音频编辑软件 Sound Forge(Sonic Foundry) Wavelab (德国Steinberg) Cool Edit (Syntrillium) 效果器软件效果器插件 Waves Native Gold Bundle(20以上) TC Native Bundle(4) Ultrafunk Sonltus fx(7)

2.4 音频处理软件一、Cool Edit概述 Cool Edit Pro 1.1/1.2/2.0/2.1 (专业版)
①编辑：插入、叠加、替换、调制等； ②音效：回音、延迟、失真、杂音等； ③分析音讯及频率； ④与Cakewalk能很好地结合。

2.4 音频处理软件 1.Cool Edit的启动和退出开始/所有程序→Cool Edit 2000 2.Cool Edit的窗口组成
标题栏菜单栏工具栏状态栏显示范围条波形显示区声音播放工具水平缩放工具时间显示区垂直缩放工具 CD播放栏音量电平表

2.4 音频处理软件二、音频的基本操作 1.声音的录制 Options/Windows Mixer→音量控制 ⑴从麦克风中输入
File/New→New Waveform对话框语音：11025Hz、Mono、8-bit 音乐：44100Hz、Stereo、16-bit ⑵从CD唱机中输入 CD唱机(波形输出混音)

2.4 音频处理软件 2.音频的编辑选择删除(选区、非选区) 复制粘贴混合粘贴

2.4 音频处理软件 3.音频文件管理新建文件打开文件保存文件另存为(其他格式) 保存选择区

2.4 音频处理软件三、调整音量大小 1.调整音量 Transform/Amplitude/Amplify菜单 Amplify对话框 Constant Amplification选项卡 2.显示振幅边界线(90%) View/Show Boundaries 3.静音(选择区域) Transform/Silence

2.4 音频处理软件四、淡入与淡出淡入效果是指音频选区的起始音量很小甚至无声，而最终音量相对效大。
淡出效果是指音频选区的起始音量相对较大，而最终音量很小甚至无声。操作步骤：选择音频区域→Transform/ Amplitude/Amplify→选择Fade In(淡入)、Fade Out(淡出)→Linear Fades(线性) Logarithmic Fades(对数)

2.4 音频处理软件五、消除环境噪音环境噪音是在语音停顿之处有一种振幅变化不大的声音，这个声音贯穿于录制声音的整个过程。
消除环境噪音的方法是在语音停顿之处选择一段环境噪音，让CE记录噪音的特征，然后自动消除所有的环境噪音。操作步骤：选取噪音样本→Transform/ Noise Reduction/Noise Reduction→双击波形显示区选取整个波形→┅

2.4 音频处理软件六、延迟效果 1.Delay延迟效果 Transform/Delay Effects/Delay菜单
Delay：延时(-500～500ms) Mixing：声音混合(0～100%) Invert：颠倒 Presets：预置模拟各种房间效果、空中回声、隧道。

2.4 音频处理软件 2.Echo回声效果 Transform/Delay Effects/Echo菜单 Echo对话框的参数：
Decay：衰减(0～100%) Delay：延时(0～2000ms) Initial Echo Volume:初始回声音量 Lock Left/Right：锁定左右声道 Echo Bounce：弹簧回声模拟声场效果，如礼堂、峡谷、大厅。

2.4 音频处理软件 3.Flanger空间感效果 Transform/Delay Effects/Flanger菜单
Original Delayed 原始声音和延时声音比例 Initial Mix Delay 初始混合延时 Final Mix Delay 最终混合延时 Stereo Phasing 立体声相位 Feedback 反馈量模拟科幻、火星人、水下等声音感觉。

2.4 音频处理软件七、正弦波发生器正弦波发生器音频信号发生器非正弦法发生器噪音发生器
正弦波发生器音频信号发生器非正弦法发生器噪音发生器 Generate/Tones→New Waveform (16000,Mono,16-bit) →Generate Tones (选中Lock to these… 400,0,0…)

2.5 MIDI与音乐合成一、MIDI技术概述 1.什么是MIDI
MIDI是一种利用合成器产生的音乐技术。 Musical Instrument Digital Interface译为乐器数字接口。利用数字信号处理技术合成的音效有： ①模仿钢琴、小提琴、吉他等音色； ②超越时空的太空音乐。

2.5 MIDI与音乐合成 2.MIDI标准 MIDI是各种电子音乐设备之间以及与计算机交换信息的国际标准。(Yamaha,Roland)
MIDI硬件规范：硬件接口标准和信号传输机制(I/O通道类型、连接电缆和插座形式)。 MIDI软件规范：音乐信息数字化编码方式(音符、音符长短、音调和音量等)。原声钢琴8分音符的C3音：音色Piano编号音符C3编号 8分音符编号

2.5 MIDI与音乐合成二、MIDI合成方式 1.调频合成法FM 原理：利用傅立叶级数进行分解。特点：①系统开销小，声音较清脆；
②声音音色少，音质差。 2.波形表合成法WT 原理：预先存放实际乐器的声音样本。特点：①音乐真实感强，音色自然。 ②硬波形表，软波形表。

2.5 MIDI与音乐合成三、MIDI的工作过程音序器是MIDI音乐创作的核心控制部件。 MIDI乐器 MIDI接口 MIDI文件
合成器扬声器音频卡 PC机音序器是MIDI音乐创作的核心控制部件。

2.5 MIDI与音乐合成四、音乐制作系统 1.基本设备音源：声卡(模拟乐器发声的设备) 音序器：硬件音序器、软件音序器
输入设备：电子琴(MIDI In,MIDI Out) MIDI键盘(省去音源) Cakewalk虚拟键盘 MIDI连接线

2.5 MIDI与音乐合成 2.音乐制作技术提取原音软件：Exact Audio Copy(EAC) MP3数字CD抓轨
把CD音轨转换成WAV格式(无失真)。音频处理软件：Cool Edit 2000 原音伴唱消除：Effect/Amplitude/ Channel Mixer→Vocal Cut VCD(卡拉OK)：左声道、右声道人声伴音

2.6 语音识别技术一、语音识别的发展历史 1952：Bell实验室研制可识别十个英文数字的语音识别器-Audry系统。
60-80:动态规划(DP)、线性预测(LP)、矢量量化(VQ)、隐马尔可夫模型、人工神经元网络(ANN)。 1988：卡内基-梅隆大学研制SPHINX系统非特定人、大词汇量、连续语音。 1997：IBM公司开发出汉语ViaVoice语音识别系统。ViaVoice98-地方口音

2.6 语音识别技术二、语音识别的基本原理三、语音识别系统的分类 1.根据词汇量大小小词汇量语音识别系统：几十词
中词汇量语音识别系统：几百词

2.6 语音识别技术大词汇量语音识别系统：几千-几万词 2.根据对说话人依赖程度特定人语音识别系统：专人非特定人语音识别系统：所有人
限定人识别系统：一组人 3.根据对说话人说话方式孤立词语音识别系统：每词后停顿连接词语音识别系统：连音连续语音识别系统：连音、变音

2.6 语音识别技术四、语音识别软件中文听写语音识别软件语音命令语音合成 IBM ViaVoice 8.0中文语音识别系统
语音识别软件语音命令语音合成 IBM ViaVoice 8.0中文语音识别系统英特尔公司的可视音频语音识别软件(AVSR)。

多媒体技术及应用 2017年9月9日星期六第二章多媒体音频技术第二章多媒体音频技术.

Similar presentations

Presentation on theme: "多媒体技术及应用 2017年9月9日星期六第二章多媒体音频技术第二章多媒体音频技术."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

多媒体技术及应用 2017年9月9日星期六 第二章 多媒体音频技术 第二章 多媒体音频技术.

Similar presentations

Presentation on theme: "多媒体技术及应用 2017年9月9日星期六 第二章 多媒体音频技术 第二章 多媒体音频技术."— Presentation transcript:

Similar presentations

About project

反馈

多媒体技术及应用 2017年9月9日星期六第二章多媒体音频技术第二章多媒体音频技术.

Presentation on theme: "多媒体技术及应用 2017年9月9日星期六第二章多媒体音频技术第二章多媒体音频技术."— Presentation transcript: