高維度資料分析 期末報告 統碩二 710533104 傅鈺婷 2018/01/10
01 資料介紹 02 探索性資料分析 CONTENT 03 維度縮減 04 分類法則
研究背景 帕金森氏症為現代老人常見的疾病之一,大多在55~60歲之間發病,並且主要會影響運動神經,這些症狀會緩慢的出現,目前並沒有有效的治療方法出現。 LSVT語音修復目標是使用機器學習辨識患者的聲音特徵及變化,利用演算法從患者聲帶運動及講話聲音的變化,而能辨識出患者是否存在神經障礙,並且協助醫生即早發現帕金森氏症並開始治療。
1 PART ONE 資料介紹
資料介紹 總共有14位患者進行語音康復治療,而每位患者總共測試9次,所以共有126筆觀察值, 有304個變數加上一項反應預測分類變數(Y) : Binary.class, 該反應變數是評估語音康復治療是否導致發音被認為為「可接受的」或是「不可接受的」。
資料介紹 變數 Jitter 頻率擾動度 Shimmer 振幅擾動度 PPE 非線性的基頻變異測量 NHR 噪聲比 RPDE 非線性動態複雜度 DFA 趨勢波動分析 Binary.class 1 2 42 84
2 PART TWO 探索性資料分析
探索性資料分析 PPE(非線性的基頻變異測量) HNR(噪聲比) RPDE(非線性動態複雜度) 2017/12/27 大部分的PPE(非線性的基頻變異測量)都集中在0附近,而當PPE偏於0時,其觀察值的NHR(噪聲比)介於0~10之間,RPDE(非線性動態複雜度)則越大。
探索性資料分析 DFA(趨勢波動分析) Jitter(頻率擾動度) Shimmer(振幅擾動度)
探索性資料分析
3 PART THREE 維度縮減
維度縮減 – 選取變數 BSS WSS Ratio 如果每組變數愈有顯著差異,則BSS相對於WSS會越大。 加入RPDE,NHR mean PPE。 後續維度縮減使用28個變數及126筆觀察值
維度縮減 – MDS
維度縮減 – MDS
維度縮減 – ISOMAP
維度縮減 – ISOMAP
維度縮減 – ISOMAP
4 PART FOUR 分類法則
分類法則 - Support Vector Machine (SVM)
分類法則 - K-Nearest Neighbors (KNN)
結論 分類法則 維度縮減 Dim Error rate SVM ISOMAP 3 0.1333 MDS 2 0.1357 KNN 0.1262 5 0.15
THANKS FOR YOUR LISTENING