信号处理与系统课程教学案例 FFT的应用—— 声音信号合成与处理 国防科技大学电子科学与工程学院
声音信号的合成与处理 音乐基础知识简介 产生模拟乐音 声音信号识别 语音修正与加强 参考文献
音乐基础知识简介 乐音的基本特征可以用基波频率、谐波频率和包络波形三个方面来描述。 基波频率决定了乐音的音高,而相同音高的乐音人耳听起来却会感觉明显的不同,这是由于谐波成分即泛音有所区别,不同乐器有自己特有的谐波分布规律,而同种乐器的不同音阶的谐波结构还可能略有区别,另外谐波也和演奏者的演奏方法和技巧有关。音乐谐波(泛音)的作用是改变乐音的“音色”。
音乐基础知识简介 乐音的波形包络是描述乐音特征的另外一个重要因素。不同类型的乐器演奏的每一个音符,不是简单的等富正字安波组合,而是一种类似与通信系统中的调制,即 形式的信号。寻找合适的波形包络函数 f(t),才能使得合成的电子音乐逼真。 另外,音乐演奏中相邻的音符有时会有些重叠,也就是一个音调还未消失,另一个已经开始被演奏,叫做“音符的叠接”,这样听起来乐音就会更连续,减少断音。
产生模拟乐音 利用matlab的声音处理的相关函数合成一段乐音。
产生模拟乐音 目前数字信号处理技术广泛应用于电子音乐合成等领域。电子合成器已称为音乐工作者的标准器材,它能够模拟钢琴、吉他、小提琴和长笛等等,模仿效果日益完善。
声音信号的识别 为了体现信号随时间的频谱情况,一般采用短时傅里叶变换(STFT)处理。 其中 w(k,t) 是一个长度为N 的窗函数, X(w,t) 是一个二维复函数,表示中心点位于 t 的加窗声音信号的傅里叶变换。 定义
声音信号的识别 定义 得到声音信号的“语谱图”。
声音信号的识别 通过语谱图,更容易进行语音信号的分析和识别。比如可以建立一个包含基本语音数据的库,对待识别的语音信号的语谱图,与库中的样本语谱图进行比对,设定合适的误差计算公式及判决准则和算法,就可以进行语音信号的自动识别。
语音修正与加强 语音修正的目的是改变语音信号并使其具有某些所需的特征,包括时域、基音和频谱方面的修正。时域修正用于将电台或电视语音信号调整到所划分的时间段,以及音频/视频同步;另外,语音加速和减速可用于消息回放等。基音和频谱修正应用于语音伪装、拼接合成和娱乐等。 语音加强用于提高受损语音的质量,降低噪声的干扰。
语音修正与加强 语音预加重:语音信号具有在高频段下落的谱,有些应用中,需要对这个高频下落用“预加重”来步长,比较简单而广泛使用的预加重方法是用如下形式的一阶差分方程进行线性滤波: 其中,x(n)是输入的语音信号,y(n)是“预加重后的语音”,a为可调整参数。
语音修正与加强 对Matlab中自带的语音女声“matlab”信号进行预加重处理
参考文献 王艳芬等.《数字信号处理》.人民邮电出版社,2010.08 徐利民等. 基于matlab的信号与系统实验教程. 清华大学出版社2010.02