梅爾倒頻譜係數 (Mel-frequency cepstral coefficients)

Slides:



Advertisements
Similar presentations
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
Advertisements

大綱 1. 三角函數的導函數. 2. 反三角函數的導函數. 3. 對數函數的導函數. 4. 指數函數的導函數.
升中面試須知 及選校策略 伍德基 學友社 社長 香港中文大學校友會聯會 張煊昌中學 校長 ( 一 ) 爭取自行分配學位 最多 2 所中學選擇 中學最多 30% 學額.
执教者:新庄中学 荔选红 一. 音调 1. 音调是指声音的高低 ; 探究 : 决定音调高低的原因 音调的高低取决于发声体振动的快慢, 振动越快音调越高,振动越慢音调越低。
九年级物理一轮复习 第一章 声现象 知识要点. 1. 声音的产生和传播  ( 1 )声音的产生:声音是由于物体的振动产生的。  凡是发声的物体都在振动。振动停止,发声也停止。  ( 2 )声源:正在发声的物体叫声源。固体、液体、气体 都可以作为声源,有声音一定有声源。  ( 3 )声音的传播:声音的传播必须有介质,声音可以在.
一、音调  听过女高音和男低音的歌唱吗?他们的声音 给你的印象是怎样的? 女高音:音调高, 男低音:音调低,比较低沉。
第一章 声现象 第二节声音的特征.
MATLAB 程式設計 時間量測 清大資工系 多媒體資訊檢索實驗室.
苏科版新教材同步教学课件 §1.4人耳听不见的声音 新沂市窑湾中学 余荣兴 探究活动:了解自己听觉的频率范围 频率 音的设备)由低到高发出不同频率的声音, 请同学们闭上眼睛仔细听,当刚听到时就 老师用一台音频发声器(发出不同频率声 音的设备)由低到高发出不同频率的声音, 请同学们闭上眼睛仔细听,当刚听到时就.
朝鲜.
健康檢查簡介 新湖國小健康中心 王淑華護理師 99/11/17.
第四章 頻率域上的濾波 4.1 背 景 4.2 初步的概念 4.3 取樣與經取樣函數的傅立葉轉換 4.4 一個變數的離散傅立葉轉換
中国汽车技术研究中心 国家轿车质量监督检验中心
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
聲音 講解/陳記住老師 謹向圖中人物表達謝意….
提升國小自然與生活科技領域教師教學智能研習
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
電子學 第八版 Floyd 第十五章.
身边的噪音 ——六(1)班班队活动 李瑷蔚 符蓉.
Strain Variation for B-Mode Image
Speaker :Fanjia Yen Adviser : Quincy Wu Date : 2007/11/15
聲紋辨識 100%自製 指導老師:趙春棠 學生:陳保均 學號:
第四組-幼兒安全 4990U005 朱靖棻 4990U051 戴安妮 4990U054 黃珮華 4990U055 周 凌
日本 班級:六年四班 座號: 八號 姓名:楊維綱.
基本程式範例.
實驗6: RC 和 RLC 電路(課本實驗21) 目的: 利用示波器觀察 RC 和 RLC 電路中電荷對時間之變化 A: RC電路
本章大綱 9.1 Sequence數列 9.2 Infinite Series無窮級數
梅爾倒頻譜係數 (Mel-frequency cepstral coefficients)
32位元處理器之定點數MFCC演算法的改進與探討 Improvement and Discussion of MFCC Algorithm on 32-bit Fixed-point Processors 學生:陳奕宏 指導教授:張智星.
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
下列敘述正確的打「○」,錯誤的打「×」。 ( )兩個等腰直角三角形一定相似。 ( )兩個梯形一定相似。 ( )兩個正六邊形一定相似。
Wavelet transform 指導教授:鄭仁亮 學生:曹雅婷.
Network Application Laboratory
電子儀器量測 Oscilloscope and function generator
FPGA計算浮點數的方法 姓名:蔡秉旂.
正交试验设计在网上购物选择时的应用 统计 高璇 黄婷 刘璐(组长)
第三节 超声与次声 想想议议 大象可以用人类听不到的‘声音’进行交流?,想想为什么。.
辨認三角形的種類 小學三年級數學科.
第九章 場效應電晶體放大器電路 9-1 小訊號等效電路模型 9-2 共源極放大器 9-3 共汲極放大器 9-4 共閘極放大器
工程數學 Chapter 10 Fourier Series , Integrals , and Transforms 楊學成 老師.
CH05. 選擇敘述.
田口方法應用於語音辨識 報告者:李建德.
聖方濟各英文小學 升中派位結果(2002/2004) 入讀英文中學:95.9% 第一組別(Band 1)學生:80.2%
共源極頻率響應 科系:通訊工程學系 執導老師:王志湖 學號:B 姓名:何信賢.
欢迎未列其中的各类新型交叉领域的论文和报告
對數能量特徵正規化於語音辨識之進一步研究
圖 計時 IC 的詳細圖.
《信息技术与教育技术》听觉媒体技术.
數位音訊 B 翁漢宇.
交流電路(R-L) R-L Series Circuits ATS電子部製作.
端點偵測介紹.
1-1 隨機的意義– P.1.
林業試驗所六龜研究中心 國立高雄應用科技大學網路應用實驗室
通信系統設計平台.
本講義為使用「訊號與系統,王小川編寫,全華圖書公司出版」之輔助教材
1-1 二元一次式運算.
力学实验复习 杨昌彪 月.
A Band Extension Technique for G.711 Speech Using Steganography
AM &FM simulation 通訊四甲 B 蕭惟尹.
語音訊號的特徵向量 張智星 多媒體資訊檢索實驗室 清華大學 資訊工程系.
端點偵測介紹.
2.4 让声音为人类服务.
語音辨識前處理介紹 Jain-De,Lee.
第三章 音樂檢索技術 1) 內涵式音樂資訊檢索(content-based music information retrieval)
4-1 變數與函數 第4章 一次函數及其圖形.
鳥聲辨識之初步研究與分析 Initial Studies and Analysis of Birdsong Recognition
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
声音的特性.
基慧小學 (馬灣) 升中選校座談會(12-14).
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

梅爾倒頻譜係數 (Mel-frequency cepstral coefficients)

倒頻譜 語音訊號可如下表示: 其中,X(n)為語音訊號 θ(n)為音源訊號 E(n)為聲道的脈衝響應信號

倒頻譜 語音訊號之頻域表示方式:

倒頻譜 對頻域的語音訊號加上絕對值與對數 在對取完絕對值與對數的訊號,進行逆傅立葉轉換, 所對應的ce(n)會落在n值較大的地方,而 所對應的cθ(n)會存在n值較小處

倒頻譜

人類聽覺特性 人類聽覺上的兩個重要特性―遮蔽效應、臨界頻帶 當某一頻率的聲音,有一特定音強存在,另一個不同頻率的聲音要將音強提高,才會被聽見,這就是遮蔽效應(Masking Effect) 遮蔽效應有兩種現象,一名為頻率遮蔽(Frequency Masking),另一名為時間遮蔽(Temporal Masking)

人類聽覺特性 同時存在的聲音,常常是低頻的聲音傾向於遮蔽高頻的聲音

人類聽覺特性 聲音在聽覺器官中,傳遞時間延遲所造成的遮蔽現象,稱時間遮蔽

人類聽覺特性 當我們改變窄頻帶聲音刺激(narrowband sound stimulus)時,其聲音成分若跨越某一頻率,則聽覺上會感到有差異,而在一頻率範圍內,則感覺不到差異,這個頻率範圍稱臨界頻帶(Critical Band) 在人類聽覺範圍內,可以分成24個臨界頻帶

頻帶編號 下限頻率 中心頻率 上限頻率 1 50 100 2 150 200 3 250 300 4 350 400 5 450 510 6 570 630 7 700 770 8 840 920 9 1000 1080 10 1170 1270 11 1370 1480 12 1600 1720 13 1850 2000 14 2150 2320

頻帶編號 下限頻率 中心頻率 上限頻率 15 2320 2500 2700 16 2900 3150 17 3400 3700 18 4000 4400 19 4800 5300 20 5800 6400 21 7000 7700 22 8500 9500 23 10500 12000 24 13500 15500

梅爾倒頻譜 梅爾量度(Mel Scale),其公式如下: 或是

梅爾倒頻譜 梅爾量度的轉換曲線

梅爾倒頻譜 梅爾倒頻譜流程圖

梅爾倒頻譜 梅爾三角濾波器組

梅爾三角帶通濾波器 三角形之頻率 假設取樣頻率為22050Hz,四個三角帶通濾波器,則將有效頻率轉成感知頻率: 11025Hz → 3176.32Hz 將感知頻率分成五個頻帶 3176.32/(4+1)=635.264 635.264 1270.528 1905.792 2541.056 3176.32 529.701 1461.25 3097.58 5972.83 11025

梅爾三角帶通濾波器 529.701 1461.25 3097.58 5972.83 11025 三角形編號 下限頻率 中心頻率 上限頻率 1 529.701 1461.25 3097.58 5972.83 11025 三角形編號 下限頻率 中心頻率 上限頻率 1 529.701 1461.25 2 3097.58 3 5972.83 4 11025

梅爾三角帶通濾波器 找出每個三角形之下限頻率、中心頻率與上限頻率 利用頻率解析度將頻率轉成點數 假設取樣頻率為22050Hz,快速傅立葉轉換後的點數為400點,則500Hz 約在傅立葉轉換後的第幾個點數? 頻率解析度=取樣頻率/轉換點數 頻率解析度: 22050/400=55.125Hz 500/55.125≈10 500Hz大約是傅立葉轉換後的第10個點數

梅爾三角帶通濾波器 利用三角公式製作出梅爾三角帶通濾波器 其中 為第j個三角形的下限頻率點數 為第j個三角形的中心頻率點數

梅爾三角帶通濾波器

梅爾倒頻譜 在Filtering步驟,先對頻域訊號進行平方運算以得到頻率能量 將頻率能量乘上梅爾三角濾波器組,並累加起來 其中J為濾波器的數量 為第j個濾波器

梅爾倒頻譜 執行DCT,其公式為: 其中,L為MFCC的維度

差量倒頻譜係數 差量倒頻譜係數(Delta Cepstrum Coefficients)的意義即在於倒頻譜參數對於時間的斜率,意即代表倒頻譜參數在時間上的動態變化 m = 1,2,…,L

差量倒頻譜係數 舉例說明,M取1: Cm(t-τ) Cm(t) Cm(t+τ)

差量倒頻譜係數