Network Application Laboratory 蛙聲辨識技術整理 報告人:陳亞仲 Network Application Laboratory
摘要 介紹 1 前處理 2 特徵擷取 3 比對與分類 4 結論 5
介紹 介紹 1 前處理 2 特徵擷取 3 比對與分類 4 結論 5
介紹 前處理 特徵 擷取 比對與分類
前處理 介紹 1 前處理 2 特徵擷取 3 比對與分類 4 結論 5
前處理 乾淨聲音 加成性雜訊 (背景雜訊) 摺積性雜訊 (通道效應) 雜訊聲音
前處理 頻譜消去法 小波去噪法 聲音訊號 去噪 絕對值能量法 平方和能量法 越零率修正法 熵值計算法 累積量化頻譜法 部分頻帶強度法 端點偵測 預強調 取音框 加窗
去噪 傅立葉轉換 估測 雜訊頻譜 所有頻譜減去估測之雜訊頻譜 頻譜消去法 傅立葉反轉換 去噪後 訊號
去噪 小波去噪法 進行比較 小波重構 去噪後 訊號 軟閾值 硬閾值 極大極小閾值 固定閾值 混合閾值…等等 選擇適合小波及分解層數 分解每層之高頻系數 選擇閾值及 閾值比較方式 軟閾值 硬閾值 極大極小閾值 固定閾值 混合閾值…等等 進行比較 小波重構 去噪後 訊號
端點偵測 絕對值能量法 平方和能量法
端點偵測 越零率修正法
端點偵測 熵值計算法 u:the mean for energy of each frame A(n):the energy of each frequency component N:total number of frequency components in FFT E(fm):the spectral energy for the frequency fm Hi’:the new negative entropy for each frame pi’(fm):the new corresponding probability density M:total number of frequency components in FFT
端點偵測 時域 熵值 能量
預強調 before after
取音框 第一個音節 音框1 音框2 音框3 音框4 音框5 音框6 音框7 音框8 音框9
加窗
特徵擷取 介紹 1 前處理 2 特徵擷取 3 比對與分類 4 結論 5
特徵擷取 平均頻譜 線性頻帶係數 共振峰 線性預估倒頻譜 梅爾頻率倒頻譜 質量中心 訊號頻寬 滑動頻譜 spectrum cepstrum descriptive 質量中心 訊號頻寬 滑動頻譜
平均頻譜
線性頻帶係數
共振峰 AP0 AP1 AP4 AP3 AP2
線性預估倒頻譜 自相關分析 m:the autocorrelation lag p:the order of the LPC analysis
線性預估倒頻譜 杜賓演算法
線性預估倒頻譜 倒頻譜運算
梅爾頻率倒頻譜
梅爾頻率倒頻譜
質量中心
訊號頻寬
滑動頻譜
比對與分類 介紹 1 前處理 2 特徵擷取 3 比對與分類 4 結論 5
比對與分類 動態時軸校正 隱藏馬可夫模型 倒傳遞類神經網路 支援向量機
動態時軸校正 sy s2 s1 t1 t2 tx
動態時軸校正 sy 4 6 2 2 4 3 5 4 1 2 2 5 tx 距離計算
動態時軸校正 sy 4 6 2 2 4 3 5 4 1 2 2 5 tx 1 遞迴演算
動態時軸校正 sy 4 6 2 2 4 3 5 4 1 2 2 5 tx 5 1 遞迴演算
動態時軸校正 sy 4 6 2 2 4 3 5 4 1 2 2 5 tx 9 5 1 3 遞迴演算
動態時軸校正 sy 4 6 2 2 4 3 5 4 1 2 2 5 tx 9 5 4 1 3 遞迴演算
動態時軸校正 sy 4 6 2 2 4 3 5 4 1 2 2 5 tx 9 10 6 8 5 4 1 3 遞迴演算
動態時軸校正 sy 4 6 2 2 4 3 5 4 1 2 2 5 tx 9 10 6 8 5 4 1 3 路徑回溯
動態時軸校正 Y sy 路徑限制 s2 s1 X t1 t2 tx
隱藏馬可夫模型
倒傳遞類神經網路
結論 介紹 1 前處理 2 特徵擷取 3 比對與分類 4 結論 5
結論 找出適合於野外環境之最佳去噪參數 分析混音蛙類種類 嘗試使用多種不同特徵參數 不同特徵參數之混合使用 持續收集標準蛙聲樣本檔 前處理 找出適合於野外環境之最佳去噪參數 分析混音蛙類種類 特徵擷取 嘗試使用多種不同特徵參數 不同特徵參數之混合使用 比對 持續收集標準蛙聲樣本檔 研究與發展兩階段以上之比對演算法
Thank you for attention