Download presentation
Presentation is loading. Please wait.
Published bySimon Sharp Modified 5年之前
1
鳥聲辨識之初步研究與分析 Initial Studies and Analysis of Birdsong Recognition
2
大綱 前言 特徵擷取 辨識模型 實驗分析 結論
3
前言 辨識系統兩大部分 語料訓練 語料辨識
4
? 特徵擷取 梅爾倒頻譜係數(Mel-scale Frequency Cepstral Coefficients, MFCC)
共振峰(Formants) 音高(Pitch) 其他特徵(Others feature) ? Pre-emphasis Frame blocking Hamming windows
5
Triangular bandpass filter
梅爾倒頻譜係數 擷取步驟: Triangular bandpass filter Delta cepstrum FFT DCT Frames
6
共振峰
7
共振峰 smoothing 擷取步驟: fundamental period Frames FFT
8
fundamental frequency
音高 基本頻率至半音的轉換公式如下: semitone = *log2(frequency/440) 擷取步驟: Frames smoothing fundamental frequency pitch 音高與頻率對照表
9
其他特徵 Aperiodicity autocorrelation Voicing degree Energy zero-crossing
10
辨識模型 高斯混合模型 隱藏式馬可夫模型
11
高斯混合模型 簡述 是由數個高斯分佈所組成的機率密度函數,利用高斯混合模型中的每一個高斯分佈來模擬各種鳥鳴的聲音類別 混合加權值 平均值向量
共變異矩陣 i=1…M 高斯混合的機率密度函數可表示成: i=1…M 其中
12
高斯混合模型 模型參數估測 辨識法則 最大可能性估算法(Maximum likelihood estimation , ML)
期望值最大化(Expectation –maximization , EM) 辨識法則 最大事後機率法則(Maximum a posteriori criterion) Initial model EM Converge? Y N END
13
隱藏式馬可夫模型 簡述 隱藏式馬可夫模型基本上是一種雙重隨機過程,而之所以稱為隱藏式是因為其中有一組隨機過程是隱藏看不見的
14
隱藏式馬可夫模型 隱藏式馬可夫的參數 轉移機率:常用A矩陣表示,EX.A(i,j) 狀態機率:常用B矩陣表示,EX.B(i,j)
15
隱藏式馬可夫模型 訓練流程圖 N features initialization Viterbi Decoding
Re-estimation Y Converge?
16
實驗分析 MFCC維度之比較
17
實驗分析 各種特徵組合之實驗
18
實驗分析 混合鳥鳴語料辨識正確率
19
結論 能量資訊與MFCCs 之組合,辨識率最高 對單一鳥類辨識26-D的MFCCs效果比較好;對混合鳥 類辨識39-D且混和數高的效果較好
本系統於28 種鳥單一種類鳥鳴辨識率為84.38%; 混 合種類鳥鳴辨識正確率達78.67%
Similar presentations