田口方法應用於語音辨識 報告者:李建德
大綱 實驗目的 實驗介紹 直交表分析 變異數分析 回應表分析 結論
實驗目的 利用田口方法找出辨識度高及速度快的參數組合
實驗介紹 實驗步驟 樣本訊號 特徵擷取 模組化 測試訊號 特徵擷取 辨識器 辨識成果
實驗介紹 預強調 取音框 漢明窗 梅爾三角濾波 特徵擷取 離散餘弦轉換(DCT) 差量倒頻譜(△C)
實驗介紹 參數因子 離散餘弦轉換(DCT) 差量倒頻譜(△C) 樣本數量
實驗介紹 實驗環境 錄製0-9的音檔,每一個數字錄13個訓練樣本 測試每一數字20次,一次實驗共作200次測試,共三次實驗 參數表 DCT sample LEVEL1 10 3 LEVEL2 15 1 8 LEVEL3 20 2 13 參數表
交值表分析 DCT △C sample Y1 Y2 Y3 Yavg MSD(10-4) η 1 98 99 97.5 98.167 1.037 39.842 2 94.5 96 88 92.833 1.165 39.336 3 84.5 87.5 80.5 84.167 1.416 38.489 4 99.5 99.667 3334.006 4.77 5 95.5 97 1.07 39.706 6 86.5 85.833 1.357 38.674 7 1.01 39.956 8 93 89.5 89 90.5 1.222 39.129 9 85.5 92.5 88.667 1.276 38.941
變異數分析 e eT 因子 變動 自由度 變異 純變動 變異比 貢獻度 DCT 267.351 2 NA △C 236.226 Sample 269.738 e 286.103 eT 1059.418 8 T
回應表分析 DCT △C Sample 1 39.222 28.189 39.215 2 27.716 39.39 27.682 3 39.342 38.701 39.383 Max-Min 11.626 11.201 11.701 DCT △C Sample
結論 以辨識率來看,取A3B2C3是最高的,但成本(時間) 也是花最久的 若考慮成本(時間),取A1B2C1 ηopt = ηA3 + ηC3 - ηavg =39.342+39.383-35.427 = 43.298 dB ηopt = ηA1 + ηC1 - ηavg =39.222+39.215-35.427 = 43.01 dB