有向無環圖支援向量機於多類 音樂識別之應用研究 指導老師: 組員名單: 陳明華 老師 謝雅雯 988C039 劉蓉茜 988V057 中華民國102年5月9日
大綱 研究問題 研究方法 研究設計 結果與討論 結論與建議 我們的研究目錄有研究問題,研究方法,研究設計跟現階段成果和面臨困難。
研究問題 現今,音樂是人們生活中不可或缺的一部份,許多人喜歡聽音樂來放鬆心情或者紓解壓力,有些店家也會播放音樂藉以製造氣氛,在不同的場合所使用的音樂類型都有所不同 。 我們希望能建立一個音樂分類方面的模型,方便使用者在眾多音樂曲目中,能夠快速的分類出所要的音樂。
研究問題 決定分類音樂之演算法 有向無環圖支援向量機(DAG-SVMs) 倒傳遞類神經網路(BPNN) 類神經網路是類似人類神經結構,是「一種基於腦與神經系統研究,所啟發的資訊處理技術」。而類神經網路模式有數十種,依學習特性的差異有分為監督式學習網路、無監督式學習網路 、聯想式學習網路 、最適化應用網路 ,我們則是選擇監督試學習網路裡的倒傳遞網路(BPNN)。選它的原因是因為BPNN這個在類神經網路學習模式中最具代表性的分類模型。
研究問題 文獻回顧與探討 王磊等人探討了在AdaBoost演算法,K-L變換和GMM模型的基礎上構造弱分類器的方法。 張燕等人採用基於Mel倒譜係數特徵的隱馬爾可夫模型對音樂進行分類。
研究方法 支援向量機(SVM) 有向無環圖支援向量機(DAG-SVMs) 倒傳遞類神經網路(BPNN)
研究方法 支援向量機(SVM) 超平面
研究方法 核心函數 線性核心函數(Liner kernel function) 多項式核心函數(Polynomial kernel function) 輻狀基底函數(Radial basis function,RBF) 雙彎曲核心函數(Sigmoid kernel function)
研究方法 支援向量機處理多類問題 一對多 一對一 二元樹 DAG-SVMs
研究方法 有向無環圖支援向量機(DAG-SVMs) DAG-SVMs方法在訓練階段要建構出每兩類間的分類面,即有k(k-1)/2個分類器。但是在分類階段,該方法將所有分類器構成一種兩方向的有向無環圖,包括k(k-1)/2個分類器和k個輸出類別,對未知樣本測試時,首先從頂部根節點開始,根據分類結果用下一層左節點或右節點繼續分類,直到底層某個輸出類別為止。 每一個圓圈都是一個SVM的二元分類器,此方法將樣本進行非類別的排除,得出分類的最終結果。 9
研究方法 倒傳遞類神經網路(BPNN) 倒傳遞類神經網路是屬於類神經網路 裡面的一種演算法 類神經網路 是一種模仿人的神經在傳遞訊息的方式,模擬人工神經元,並組合成人工神經網路 BPNN這種演算法可以將資訊利用誤差反向傳播,不斷調整模型中的權重與閥值,讓輸出接近我們期望的輸出值 現在看到BPNN的模型架構而BPNN的架構分三層,有輸入層、隱含層和輸出層,隱含層其實可以有好幾層,這邊以一層為例 輸入層從外部接收資訊,不會做任何計算,將資訊傳遞給隱含層 隱含層將這些資訊加以分析,然後傳入下一層,逐層處理,如果輸出層得不到期望輸出,則轉入反向傳播,根據預測誤差 來調整連接的權值和神經元中的閥值,從而使BP神經網路 的預測輸出不斷逼近期望輸出
研究設計 研究樣本 分為民歌、古箏、搖滾、流行等四類音樂,各類有500筆,合計2000筆音樂特徵資料。 資料集每筆資料有24個條件屬性與1個類別屬性。 取自MATLAB中文論壇提供的語音特徵提取資料 11
研究設計 DAG-SVMs之架構 BPNN之架構 建立3個節點 輸入層:24個節點 隱藏層:25個節點 輸出層:3個節點 模型建構方面 在實際執行時我們將以四類音樂資料中取出三類來製作模型,這就會有四種類別組合 DAG-SVMs的模型再處理三類資料時會建立3個節點,也就是有3個SVM的分類器 BPNN部分,也是輸入三類資料,將24個條件屬性的三類資料製成 的BPNN模型
結果與討論 DAG-SVMs和BPNN─民歌、古箏、搖滾之組合 比較 以下是四類音樂取三類的各組合執行結果 執行10次的準確率加以平均所得的平均準確率
結果與討論 DAG-SVMs和BPNN─民歌、古箏、流行之組合 比較
結果與討論 DAG-SVMs和BPNN─民歌、搖滾、流行之組合 比較
結果與討論 DAG-SVMs和BPNN─古箏、搖滾、流行之組合 比較
結果與討論 DAG-SVMs與BPNN之四類比較 總合四種組合的各類準確率 加以平均成這張圖 所以綜合比較上是BPNN的準確率高於DAG-SVMs
結果與討論 影響DAG-SVMs模型準確度之因素 分類類別 民歌、搖滾 民歌、流行 搖滾、流行 RUN 1 49.6% 96.4% 90.4% RUN 2 50.0% 99.2% 99.6% RUN 3 100.0% 97.2% RUN 4 93.6% 90.0% RUN 5 98.8% 92.4% RUN 6 RUN 7 91.6% RUN 8 98.4% RUN 9 50.4% RUN 10 97.6% 84.0% 平均 49.9% 98.3% 94.1% 從結果看來,DAG-SVMs的分類準確度稍微偏低 於是我們就就 來進行討論 這裡提出分類準確度較低 這個DAG-SVMs組合進行分析,這是的DAG-SVMs中各節點 對自己的訓練類別進行預測的準確率
結果與討論 原類別 流行 搖滾 民歌 判斷分類 RUN 1 65.6 % 34.4 % 97.6 % 2.4 % 68.8 % 31.2 % 79.2 % 20.8 % 100.0 % 0.0 % 96.0 % 4.0 % RUN 3 89.6 % 10.4 % 99.2 % 0.8 % 92.8 % 7.2 % RUN 4 76.0 % 24.0 % 83.2 % 16.8 % RUN 5 81.6 % 18.4 % RUN 6 87.2 % 12.8 % 98.4 % 1.6 % RUN 7 73.6 % 26.4 % RUN 8 63.2 % 36.8 % RUN 9 67.2 % 32.8 % 86.4 % 13.6 % RUN 10 72.8 % 27.2 % 94.4 % 5.6 % 60.8 % 39.2 % 平均 75.6 % 24.4 % 96.9 % 3.1 % 83.8 % 16.2 % 在DAG-SVMs模型中我們將各節點用有兩個類別的資料進行訓練,然後共同用三個類別的資料進行測試 這麼一來各節點在預測上將會有一個無法辨識的類別,但是以模式上還是會分向較接近的一類 所以我們找出各節點對第三類音樂資料的分類進行比較,發現 綜合來看無法分類的資料有高機率分項民歌類,使民歌類的正確率增加,這也影響了DAG-SVMs在分類上的準確率
結論與建議 本研究對四類音樂(民歌、古箏、搖滾、流行)進行分類識別,使用DAG-SVMs 建構預測模型,進行方式是從四類音樂中任意組合三類分別建模測試,結果顯示,各組合中有些單一類別的 DAG-SVMs 準確率較 BPNN 高,但DAG-SVMs對相近音樂模式的分類辨識度較低,綜合準確度是 BPNN 模型略優於 DAG-SVMs 模型。 本研究所使用之 DAG-SVMs 模型,僅使用 SVM 做為分類節點,後續可進一步嘗試結合使用不同分類演算法進行研究,提升多類識別之準確率。 本研究所提出之用 DAG-SVMs 模型,未來可進一步就其他領域之分類問題,進行測試,以擴展本模型之推廣應用能力。 之後 利用熵方法或地毯式搜尋的方法解決 並將DAG-SVMs模型建立完成
END