稀疏雙反旋積非負矩陣分解法結合遮罩應用於蛙類盲訊號分離之研究 學生:李建德 指導教授:陳文平 博士 電機工程系 國立高雄應用科技大學 網路應用實驗室
大綱 前言與動機 相關背景知識 研究方法 實驗結果 結論與未來展望
前言 現代生態調查技術 優點 缺點 聲紋辨識系統 感測網路 無線網路 改善人力及時間的成本消耗 資料保存及分享便利 資料量龐大分析不易 快速分析聲景資料
前言
前言 盲訊號分離 雞尾酒會問題
前言 獨立子空間分析: 溫尼濾波器: 非負矩陣分解法: M. A. Casey and A. Westner[2000] Proceedings of the International Computer Music Conference Md. K. I. Molla and K. Hirose[2007] IEEE Transactions on Audio, Speech, and Language Processing 溫尼濾波器: L. Bonaroya and F. Bimbot[2003] International Symposium on Independent Component Analysis and Blind Signal Separation E. M. Grais and H. Erdogan[2011] IEEE Digital Signal Processing, Sedona, Arizona 非負矩陣分解法: P. Smaragdis[2004] International Symposium on Independent Component Analysis and Blind Source Separation
前言 獨立成分分析法結合其他方法: J. Lin and A. Zhang[2005] NDT & E International M. E. Davies and C. J. James[2007] Signal Processing X. Cheng, N. Li, Y. Cheng and Z. Chen[2007] International Conference on Bioinformatics and Biomedical Engineering B. Mijović, M. D. Vos, I. Gligorijević, J. Taelman and S. V. Huffel[2010] IEEE Transactions on Biomedical Engineering
動機 單通道盲訊號分離 聲紋辨識系統之前處理 提升分離訊號的品質
相關背景知識 後處理 訊號重建 盲訊號分離 獨立成分分析法、非負矩陣分解法 預處理 白色化、時頻轉換
相關背景知識 獨立成分分析法 從觀測訊號中找出統計獨立成分計算出解混合矩陣 限制條件 處理步驟 原始訊號必須具備統計的獨立特性 原始訊號中只允許一個成分為高斯分布 觀測訊號至少要大於或等於原始訊號 處理步驟 預處理 置中化 白色化 量測非高斯成分
超高斯分布(Super-Gaussian) 相關背景知識 量測非高斯訊號 峰態 交互資訊 負熵 隨機變數y 峰度值kurt(y) 高斯分布(Gaussian) kurt(y) = 0 非高斯分布(Non-Gaussian) 超高斯分布(Super-Gaussian) kurt(y) > 0 次高斯分布(Sub-Gaussian) kurt(y) < 0 J(Y):負熵值 H(Ygauss):高斯分布的隨機變數之熵值 H(Y):待測的隨機變數之熵值
相關背景知識 非負矩陣分解法
相關背景知識 非負矩陣分解法 目標函數 基於歐式距離 基於KL散度 V :原始訊號 :重建訊號
相關背景知識
相關背景知識 稀疏雙反旋積非負矩陣分解法(SNMF2D) 雙反旋積非負矩陣分解法 稀疏編碼 取得頻譜資訊與音高變化 稀疏控制因子 τ個基底矩陣與φ個係數矩陣 移動(Shift)陣列元素 稀疏編碼 用少數的元素表示整體資訊 局部化
相關背景知識
相關背景知識 稀疏雙反旋積非負矩陣分解法 目標函數 基於歐式距離 基於KL散度 f(•):稀疏函數 λ:稀疏因子
相關背景知識
研究方法
研究方法 預處理 時域訊號轉時頻訊號 取分析視窗 窗函數 訊號轉換
研究方法
研究方法 拉都希氏赤蛙之重建訊號 梭德氏赤蛙之重建訊號
遮罩修正 遮罩修正
遮罩修正 遮罩二元化 重建訊號轉換成二位元的遮罩訊號 尋找適當的門檻值T G(x,y): 重建訊號 M(x,y): 二位元遮罩訊號
遮罩修正 Otsu演算法 建立直方圖 Number Element
遮罩修正 T T T T T T Element L
遮罩修正
遮罩修正 擷取訊號 V(x,y):原始混合訊號 S(x,y): 擷取後的訊號
遮罩修正
遮罩修正 , 計算混合比例 GT(x,y): 分離訊號總和 Gi(x,y): 第i個分離訊號 Ri(x,y): 第i個混合比例 N: 分離訊號的數量
遮罩修正 訊號修正 , :擷取訊號 :調整訊號
遮罩修正 訊號修正 , :修正後的訊號
遮罩修正
後處理 相角資訊 離散傅立葉逆轉換 窗函數
實驗結果 Parameter Items Parameter Value STFT Window Size 512 samples Parameter Items Parameter Value STFT Window Size 512 samples Window Overlapping 50% Window Function Hamming Window Frequency Bin 512 SNMF2D Basis Matrix [1…3] Coefficient Matrix [1…5] Sparse Factor 5 Frog Species 8 Mixtrue Items 7
實驗結果 評估因子—SDR(Signal-to-Distortion Ratio)
實驗結果 評估因子—SIR(Source-to-Interference Ratio)
實驗結果 Method Iterations Variance SNMF2D 30 10.71275 50 7.56728 SNMF2D+MASK 27.73557 19.40138
Mel-Frequency Cepstral Coefficient 實驗結果 Parameter Items Parameter Value Frame Length 512 samples Frame Overlapping 50% Window Function Hamming Window Frequency Bin 512 Feature Parameters Mel-Frequency Cepstral Coefficient Feature Dimensions 15D Test Syllable 410
實驗結果 辨識實驗 Method Iterations Total Syllable Correct Syllable Accuracy(%) SNMF2D 30 410 203 49.51 50 200 48.78 80 205 SNMF2D+MASK 318 77.56 323 78.78 334 81.46
結論與未來展望 本論文所提出的方法 有效提升分離訊號的品質 利用較少的時間成本,提升分離訊號的品質 能有效的提升分離訊號的辨識率,平均辨識率可提升29.84%
結論與未來展望 未來展望 去噪方法之研究 判斷音檔物種的數量 初始值設定之研究 蒐集物種多樣性之聲音,並建立樣本於資料庫以提升辨識率
作者介紹 比賽 第七屆數位訊號處理創思設計競賽—入圍 專利 蛙聲混音分離方法—審查中
Thank you for your attention !!