数字音频技术 曾兰芳 教育技术学院 zenglf2003@163.com.

Slides:



Advertisements
Similar presentations
音频编辑 第4章第4章. 第 4 章 音频编辑 4.1 数字音频概述 4.2 Audition 音频编辑技术 4.3 习题和思考 内容提要.
Advertisements

复 习 下列设备哪些是输入设备,哪些是输出设备,哪些既 是输入设备又是输出设备 ? – 鼠标、音箱、扫描仪、 mp3 随身听、打印机、 – 写字板、键盘、麦克风、显示器、 U 盘。 输出设备: – 音箱、打印机、 显示器 输入设备: – 鼠标、扫描仪、 写字板、键盘、 麦克风 输入输出设备 – mp3.
第 3 章、音訊媒體. 2 本章大綱 音訊原理 音訊儲存格式 音訊播放 3 影響測量結果的因素 – 以溫度測量為例 測量時間間隔 間隔愈短, 測量次數愈多, 資料愈詳細 間隔愈長, 測量次數愈少, 資料愈粗略 測量單位 單位愈小, 精確度愈高, 需記錄的內容多 單位愈大, 精確度愈低, 需記錄的內容少.
多媒體概論 第一章.
「我是剪輯&簡報達人」 --電影教學法在語文領域之應用
扬声器的布置与安装.
多媒体通信技术 主讲教师:黄玉兰                学时:16.
第六章 多媒体辅助教学系统 一、多媒体基本概念
第 3 章 聽覺 每章扉頁 3.1 聽覺 3.2 人類耳朵的反應 3.3 聽覺缺陷.
第六章 音频信息及处理 Shan dong Economics University.
第一部分 中考基础复习 第一章 声现象.
第 9 章 多媒體.
第一次作业知识讲解 我和我的小伙伴们 薛坚、黄进 杨军裕、刘旭宁、李启宏.
第一章 多媒体概述 计算机系 李 妍 2017/3/13.
第三章《媒体的采集与制作》教学 指导意见解读
第4章 多媒体音频处理技术.
模块4 理解和熟悉信息化教学 青海省西宁市湟中一中
第五章 计算机辅助教学.
PPT模板下载: 电子文件归档及管理.
市八中学 胡亮平 办公室:F504 高中信息科技 市八中学 胡亮平 办公室:F504
網頁介面設計的基礎理論 講師:鄭靜怡 本教材內容出自於網頁界面設計藝術教程,人民郵電出版社.
与 维 计 思 算 算 文 计 化 第 2章 数字革命—神奇的数字化 .
第 9章 多媒体技术基础.
计算机应用基础.
《多媒体应用基础》 第五章 数字视频处理技术 第5章 数字视频处理技术.
第七章 多媒体应用基础.
影视制作必备知识.
第1章 多媒体技术概述 多媒体技术及应用基础 计算机教学实验中心 2007.
多媒体技术及应用 2017年9月9日星期六 第二章 多媒体音频技术 第二章 多媒体音频技术.
4.1 音频信号概述 4.2 音频信号的获取与处理 4.3 话音信号的参数编码 4.4 乐器数字接口MIDI 4.5 声卡概述
第八章 多媒体技术基础.
第十课 创新意识与社会进步 1.辩证的否定观:辩证否定、形而上学的否定观
七年级信息技术-上册 第2节 信息技术与我们的生活.
课标版 政治 第一课 美好生活的向导.
目标 理解多媒体的基本概念、多媒体信息及技术的特点、多媒体技术的应用。掌握多媒体计算机系统的基本组成及简单原理。
Audio.
第五章 視訊媒體.
第5章、視訊媒體.
第二章音訊媒體.
中文輸入 拼音輸入法 拆字輸入法 綜合拼音與拆字輸入法 中文手寫輸入法 掃描、中文圖形輸入: 語音輸入法: 微軟新注音、自然輸入法
數位家庭我的家 大導演開麥拉 社區大學電腦講師 黃仲銘
電腦數位音樂介紹 11組 電機三 陳俊傑 吳岳庭.
多媒體元素.
第二章 声音和语音编码 南通大学计算机应用教研室.
5.1 不同的視像屬性 5.2 常見的視像檔案格式 5.3 在視像檔案容量與質素之間取得平衡 5.4 按需要選擇視像檔案格式
各種媒體的類型及其差別 Text-tex,txt Audio-wav, mp3, wma, rm, mid
声音的格式 Wav:目前最通用的格式,音质好,但是文件较大 Mp3:目前互联网上音乐的主流,文件小,CD级的音质
Ulead Video Studio 8.0 電機四 王崇安.
第 二 章 信息的获取.
記錄片的剪接與後製 以威力導演5為例 林凱胤
第十三章 音频水印 13.1音频水印特点 13.2音频水印算法评价标准 13.3音频水印分类及比较
計算機概論 請老師填入姓名主講 課本:數位傳真2012 博碩文化出版發行.
常見的聲音格式 MP3 聲音格式:有鑑於WAV 聲音檔實在太大, 因此就產生了MP3 聲音格式。其利用MPEG 壓縮法將音樂進行失真性壓縮, 一段50 MB 左右的WAV 檔轉成MP3格式之後, 往往只剩下 4、5 MB。 雖然MP3 是採用失真性壓縮的演算法, 但還能維持不錯的音質, 一般人並無法聽出轉換前後的細微差別。同時也因為儲存空間大幅減少而廣受歡迎。
多媒體素材概要 圖片聲音和視迅.
[ ] 2010·课件制作培训.
网 站 设 计 与 建 设 Website design and developments
计算机维修与维护 第八章 声卡和音箱 教学目的: 教学重点(难点): 教学用具:声卡、音箱各一 教学课时:2课时
第2章 数字声音及MIDI简介.
PPT素材的处理 —— 音频的处理.
Cool Edit Pro V2.1集声音录制、混音合成、编辑处理是一款数字音频编辑软件,
第二章 多媒体的硬件和 软件环境的建立 返回.
多媒体技术基础 作者:韩小芳
媒体基础(一) 向辉 山东大学软件学院 2003年秋季.
多媒体信息编码.
多媒体信息编码.
2017学考复习 多媒体信息编码.
3.4.2 声音媒体的采集与制作.
计 算 机 应 用 基 础 潍坊学院 计算机工程学院 主讲人 王鑫.
網路智慧財產權 著作權法.
第9章 多媒体技术.
Presentation transcript:

数字音频技术 曾兰芳 教育技术学院 zenglf2003@163.com

主要内容 声音及其属性 数字化音频 音频压缩技术 音频文件类型 编辑制作数字音频素材 GoldWave 录音机

一、声音及其属性 声音是由空气中分子的振动而产生的。它是通过空气传播的一种连续的波,叫声波。自然界的声音是一个随时间而变化的连续信号,可近似地看成是一种周期性的函数。通常用模拟的连续波形描述声波的形状,单一频率的声波可用一条正弦波表示。

声音的分类 语音:人的说话声不仅是一种波形, 而且还通过语气、语速、语调携带着比文本更加丰富的信息。这些信息往往可以通过特殊的软件进行抽取。 音乐:音乐是一种符号化了的声音,这种符号就是乐谱,音乐则是转变为符号媒体形式的声音。 音效:为增进场面之真实感、气氛或戏剧信息,而加于声带上的杂音或声音。简单地说,音效就是指由声音所制造的效果。

声音的三要素 音调:声音的高低(物理学定义);与声音的频率正相关。高音和低音 音强:声音的响亮程度,与振幅相关,取决于声波信号的强弱,与声音信号的幅度成正比。分贝dB。常说的“音量”指的是音强。 音色:音的感觉特性,与波形相关,取决于声波的频谱,由混入基音的泛音所决定。若中、高泛音丰富,音色就明亮;若低频泛音丰富,音色就低沉。

二、数字化音频 音频 定义:人类听觉所感知范围内的频率,也称声频 按照人们听觉的频率范围,对声音的分类: 次声波:频率低于20Hz的信号,也称为亚音频 音频:频率范围在20~20kHz的声音信号,人耳能够听到的声音信号。属于多媒体音频信息范畴。 超声波:频率高于20kHz的声音信号,也称为超音频

次声波 超声波 音频信号 语音信号 f/Hz 20 300 3000 20000 图:按频率分类的声音

声音数字化 音频信号(Audio)是指带有语音、音乐和音效的有规律的声波的频率、幅度变化的信息载体。它分为模拟音频信号和数字音频信号两种。其中,模拟音频用模拟电压的幅度表示声音强弱,模拟声音在时间上是连续的。而数字音频是一个数据序列,在时间上是离散的,是由许多二进制数1和0组成的。

声音数字化(续1) 模拟音频数字化:采样、量化、编码 模拟信号 采样 量化 编码 数字信号 振幅 频率 1/T 采样点 T 采样--每隔一定时间间隔在模拟波形上取一个幅度值。 量化--将每个采样点得到的幅度值以数字存储。 编码--将采样和量化后的数字数据以一定的格式记录下来。 振幅 1/T T

声音数字化(续2) 数字音频的技术指标: 采样频率: 每秒钟的采样次数 奎斯特采样理论:采样频率f(1/T)高于输入信号最高频率的两倍,则经过采样后的采样信号能够包含原模拟信号的全部信息,且经过反变换和低通滤波后可不失真地恢复原模拟信号。 CD激光唱盘采样的三个标准频率分别为44.1kHz,22.05kHz和11.025kHz 量化位数(采样精度、量化精度) :存放采样点振幅值的二进制位数。通常量化位数有8位、16位,分别表示有28、216个等级。 声道数 :声音通道的个数 ,即一次同时产生的声波组数。 采样频率遵循奈奎斯特采样理论:若对某一模拟信号进行采样,只要采样频率f(1/T)高于输入信号最高频率的两倍,则经过采样后的采样信号能够包含原模拟信号的全部信息,且经过反变换和低通滤波后可不失真地恢复原模拟信号。例如,电话话音的信号频率约为3.4kHz,采样频率就选为8kHz。根据该采样理论,CD激光唱盘采样频率为44.1kHz,可记录的最高音频为22.05kHz,这样的音质与原始声音相差无几,也就是常说的超级高保真音质。采样的三个标准频率分别为44.1kHz,22.05kHz和11.025kHz。 00000001-8位

单声道 立体声 准立体声 四声道环绕 5.1声道 7.1声道 比较原始的声音复制形式 ,缺乏位置感 。 声音在录制过程中被分配到两个独立的声道,很好的声音定位效果。 准立体声 在录制声音的时候采用单声道,而放音有时是立体声,有时是单声道。 四声道环绕 规定了4个发音点:前左、前右,后左、后右,可以提供多个不同方向的声音环绕。 5.1声道 来源于4.1环绕,不同之处在于它增加了一个中置单元。这个中置单元负责传送低于80Hz的声音信号,在欣赏影片时有利于加强人声。美国杜比AC-3(Dolby Digital)、欧洲DTS等。 7.1声道 在5.1的基础上又增加了中左和中右两个发音点

数字化声音的质量和存储量 例如,CD音乐,用44.10 kHz的采样频率,16位的精度存储, 数据量(Byte)=(采样频率×量化精度×声道数×声音持续时间)/8 例如,CD音乐,用44.10 kHz的采样频率,16位的精度存储, 一般是立体声(两个声道),则录制1秒钟的立体声节目, 其WAV文件所需的存储量为: 44 100×16×2/8=176 400(字节)=0.176MBps 一个小时的CD音乐需要约635MB的存储空间 如果使用5.1声道,则存储量为: 44 100×16×5.1/8=0.45MBps 一个小时的CD音乐需要约1.62G的存储空间

不同类型信号的采样频率和量化精度 信号类型 频率范围(Hz) 采样频率(kHz) 量化精度(bit) 单声道/立体声 数据率(未压缩) (kB/s) 电话话音 200~3400 8 单声道 调频广播(AM) 20~15000 11.025 11.0 宽带音频(FM) 50~7000 22.050 16 立体声 88.2 CD 20~22000 44.1 176.4 DAT 48 192.0

三、音频压缩技术 对原始数字音频信号流(PCM)编码运用恰当的数字信号处理技术,在不损失有用信息量,或引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。 音频数据压缩比=压缩后的音频数据/压缩前的音频数据

音频压缩算法的主要分类 无损压缩 利用信息相关性进行的数据压缩并不损失原信息的内容。是一种可逆压缩,即经过文件压缩后可以将原有的信息完整保留的一种数据压缩方式,如wav、flac、ape等格式。 有损压缩 经压缩后不能将原来的文件信息完全保留的压缩,是不可逆压缩。如JEPG、MPEG压缩,常见格式如mp3、wma。

音频压缩技术标准 国际电报电话咨询委员会 CCITT(现国际电信联盟 ITU-T)标准 MPEG-1:规定了音频压缩三种模式 16Kbps CCITT标准化方案G.728:面向带宽为64Kbps的ISDN线路的可视电话上 32Kbps CCITT标准化方案G.721:应用于电视会议系统的语音编码和数字电话的语音合成 64Kbps CCITT标准化方案G.722:面向7kHz带宽以语音和音乐为对象的标准化音响编码方案 MPEG-1:规定了音频压缩三种模式 层I、层II(MP2)、层III(MP3) Dolby AC-3:多声道音频信号压缩 MPEG-2BC:多声道音频信号压缩

四、音频文件格式 声音文件格式 MIDI文件格式

声音文件格式 波形文件,Windows本身存放数字声音的标准格式,扩展名.wav ,是一种未经压缩处理的音频数据。体积大(1分钟的波形文件需要10MB)。 CD Audio,亦称CD音乐,扩展名.cda。记录的是波形流,无法编辑,文件大。 Real Audio,扩展名.ra、.ram,Real公司开发的主要适用于网上实时数字音频流技术的文件格式。高保真方面不及mp3。需要使用Real Player。 MPEG-3,扩展名.mp3。压缩率大。音质不及波形文件。 MIDI,扩展名.mid,目前最成熟的音乐格式,实际上已经成为一种产业标准。优点是短小,缺点是播放效果因软、硬件而异。 RMI文件,Microsoft公司的MIDI文件格式,可以包括图片标识和文本。

声音文件格式 (续1) Creative Musical Format,扩展名.cmf,Creative公司的专用音乐格式,和MIDI差不多,在音色和效果上有些特色,专用于FM音频卡,兼容性差 VOC文件,Creative 公司的波形文件格式,也是声霸卡使用的音频文件格式。每个VOC文件由文件头块Header Block和音频数据块Data Block组成。文件头包含一个标识版本号和一个指向数据块起始的指针。数据块分成各种类型的子块,如声音数据静音标识ASCII码文件重复的结果及终止标志、扩展块等 PCM文件,模拟音频信号经A/D转换直接形成的二进制序列,该文件没有附加的文件头和文件结束的标志。

MIDI 什么是MIDI MIDI(Musical Instrument Digital Interface)是乐器数字接口的英文缩写,它是指数字乐器与计算机连接的接口,即在数字乐器与计算机相连接时所使用的可以直接插入在计算机串口上的一个小部件,通过它可以使数字乐器与计算机相互“沟通”信息。 MIDI的特点是其文件内部记录的是演奏数字音乐的全部动作过程。比如,音色、音符、延时、音量、力度等信息,所以其数据量很小。

MIDI端口:一台MIDI设备可以有一至三个MIDI端口,MIDI In、MIDI Out、MIDI Thru。MIDI In接收来自其它MIDI设备的MIDI信息;MIDI Out发送本设备上生成的MIDI信息到其它设备;MIDI Thru将从MIDI In端口传来的信息转发到相连的另一台MIDI设备上。 MIDI键盘:用于MIDI乐曲演奏,本身不发出声音,当作曲人员触动键盘上的按键时,就发出按键信息,所产生的仅仅是MIDI音乐消息,再由音序器录制生成MIDI文件。 音序器:用于记录、编辑、播放MIDI的声音文件。 合成器:解释MIDI文件中的指令符号,生成所需要的声音波形,经放大后由扬声器输出 。

MIDI文件格式 MIDI 扩展名为.mid,目前最成熟的音乐格式。 RMI文件 Microsoft公司的MIDI文件格式。

五、编辑制作数字音频素材

常见数字音频处理软件 Vegas Cool Edit/ Adobe Audition SoundForge SONY公司推出的一款整合视频与音效编辑的软件。将剪辑、特效、专长、烧录等功能正合为一体。适用与专业人士或个人用户。 Cool Edit/ Adobe Audition 以前是数字音频软件制作公司Syntrillium Software的产品,Syntrillium的旗舰软体就是--Cool Edit Pro。现在被Adobe 公司收购了,并升级为Adobe Audition SoundForge SonicFoundry公司开发的产品。SoundForge处理的是相对比较庞大的音频和视频文件,对磁盘空间和碎片等指标都有一定的要求。

GoldWave 可对音频编辑、播放、录制、转换,体积小巧。 可打开的音频文件包括WAV, OGG, VOC, IFF, AIF, AFC, AU, SND, MP3, MAT, DWD, SMP, VOX, SDS, AVI, MOV, APE等格式。 可从 CD 或 VCD 或 DVD 或其它视频文件中提取音频。

菜单栏 工具栏 左声道 右声道 状态栏

设置黄色键为播放选择部分,或者未选部分,改变循环次数为1或2,看效果。

如何从CD中获取音频 把CD放入光驱 在GoldWave中,选择工具菜单/CD读取器 选择相应的曲目 选取“保存”,修改保存路径后,单击“确定”。

录音前的准备 录音之前,一定要调整声音控制面板参数

在GoldWave中录音 新建文档:“文件”菜单/新建,设置采样频率、持续时间 单击控制器上的红色录音按钮,开始录音(如录制一首诗) 保存文件 改变声道:立体声、单声道,在控制器中看差异

选择要处理的音频 如何选择一段音乐 如何选择一个声道 在播放过程中,设置开始和结束标志,可以选出你需要的部分。特点是边听边选,比较精确。 编辑/标记/放置开始标记 或 放置结束标记 在非播放状态,首先选择选示按钮,然后利用鼠标拖动画框,就可以选择相应的部分。 如何选择一个声道 编辑/声道/左声道 shift+ctrl+L 编辑/声道/右声道 shift+ctrl+R

简单声音编辑 删除声音片断 剪贴片断 静音处理 不选择声道的时候,删除片断 选择某声道的时候,删除片断 选择编辑区域,编辑/静音 与删除声音片断不同的是,变成静音的编辑区域仍然存在,其时间长度不变

声音的淡入淡出效果 混响设置 选择需要设置淡入或淡出效果的区域,可以是单声道,也可以是双声道 单击淡入或淡出效果按钮,设置淡入或者淡出效果 选择区域 设置混响

特殊音效 机器人声音: 倒序声音: 时间调整 把原始声音加工成类似机器发出的声音。 将声音数据反相排列。 改变声音的长度(缩短或者加长) 整个声音文件,或者局部编辑区域

去噪 先选择波形,然后点击【效果】菜单中的“滤波器”中的“降噪” 在预置中选择“减少嗡嗡声”,点击确定

制作实例:语音和背景音乐的合成 如何实现声音合成:背景音乐和人的声音 打开背景音乐,并复制 新建一个文件,把背景音乐粘贴过来 打开人声文件,并复制 在刚才新建的文件中,编辑/混音

如何去掉不想要的部分,比如开头部分 在最开始的地方,单击右键,设置开始标志 播放音乐,在需要的地方暂停 单击右键,设置结束标志 删除即可

音乐淡出-朗读声-音乐淡出 首先在英语朗读文件的前面添加10秒钟的静音效果,同时把朗读文件后部不必要的部分删除。 在背景音乐的前部和后部设置淡出和淡入效果,中间部分设置音量变化(把声音变小) 把英语朗读文件与背景音乐文件进行混音合成

如何调整背景音乐的音量? 打开背景音乐 选择需要调整音量的部分 效果/音量/更改,调整相关的参数即可

交叉减弱效果,比如音乐逐渐减弱,语音逐渐增强,或者相反 打开语音文件 打开音乐文件,并选择某段音乐复制 点击语音文件,编辑/交叉减弱,设置是在文件头还是文件尾,设置交叉减弱的时间、曲线等。

GoldWave 软件主要功能 以不同的采样频率录制声音信号:语音、CD等 声音剪辑:截取声音、去掉某段声音、移动某段声音、连接两段声音等 增加特殊效果:混响、回声、改变频率产生特殊效果、声音的淡入淡出效果等 文件操作:新建、调入、保存或删除数字音频文件

录音机的使用 录音机的使用 程序/附件/娱乐/录音机 如何录制声音

如何处理声音 此处两个例子: (1)插入两个声音文件 (2)对声音文件进行效果处理