LSVT Voice Rehabilitation

Slides:



Advertisements
Similar presentations
四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
Advertisements

主编:邓萌 【点按任意键进入】 【第六单元】 教育口语. 幼儿教师教育口 语概论 模块一 幼儿教师教育口语 分类训练 模块二 适应不同对象的教 育口语 模块三 《幼儿教师口语》编写组.
第一組 加減法 思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.
海南医学院附 院妇产科教室 华少平 妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.
植树节的由来 植树节的意义 各国的植树节 纪念中山先生 植树节的由来 历史发展到今天, “ 植树造林,绿化祖国 ” 的热潮漫卷 了中华大地。从沿海到内地,从城市到乡村,涌现了多少 造林模范,留下了多少感人的故事。婴儿出世,父母栽一 棵小白怕,盼望孩子和小树一样浴光吮露,茁壮成长;男 女成婚,新人双双植一株嫩柳,象征家庭美满,幸福久长;
客户协议书 填写样本和说明 河南省郑州市金水路 299 号浦发国际金融中 心 13 层 吉林钰鸿国创贵金属经营有 限公司.
浙江省县级公立医院改革与剖析 马 进 上海交通大学公共卫生学院
第二章 环境.
教师招聘考试 政策解读 讲师:卢建鹏
了解语文课程的基本理念,把握语文素养的构成要素。 把握语文教育的特点,特别是开放而有活力的语文课程的特点。
北台小学 构建和谐师生关系 做幸福教师 2012—2013上职工大会.
福榮街官立小學 我家孩子上小一.
第2期技職教育再造方案(草案) 教育部 101年12月12日 1 1.
企业员工心态管理培训 企业员工心态管理培训讲师:谭小琥.
历史人物的研究 ----曾国藩 组员: 乔立蓉 杜曜芳 杨慧 组长:马学思 杜志丹 史敦慧 王晶.
教育部高职高专英语类专业教学指导委员会 刘黛琳 山东 • 二○一一年八月
淡雅诗韵 七(12)班 第二组 蔡聿桐.
第七届全国英语专业院长/系主任高级论坛 汇报材料
小數怕長計, 高糖飲品要節制 瑪麗醫院營養師 張桂嫦.
制冷和空调设备运用与维修专业 全日制2+1中等职业技术专业.
会计信息分析与运用 —浙江古越龙山酒股份有限公司财务分析 组员:2006级工商企业管理专业 金国芳 叶乐慧 魏观红 徐挺挺 虞琴琴.
第六章 人体生命活动的调节 人体对外界环境的感知.
芹菜 英语051班 9号 黄秋迎 概论:芹菜是常用蔬菜之一,既可热炒,又能凉拌,深受人们喜爱。近年来诸多研究表明,这是一种具有很好药用价值的植物。 别名:旱芹、样芹菜、药芹、香芹、蒲芹 。 芹菜属于花,芽及茎类。
2012年 学生党支部书记工作交流 大连理工大学 建工学部 孟秀英
北京市职业技能鉴定管理中心试题管理科.
2014吉林市卫生局事业单位招聘153名工作人员公告解读
各類所得扣繳法令 與申報實務 財政部北區國稅局桃園分局 103年9月25日
初級游泳教學.
爱国卫生工作的持续发展 区爱卫办 俞贞龙.
第八章 数学活动 方程组图象解法和实际应用
本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响. 本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响.
散文鉴赏方法谈.
比亚迪集成创新模式探究 深圳大学2010届本科毕业论文答辩 姓名:卓华毅 专业:工商管理 学号: 指导老师:刘莉
如何撰写青年基金申请书 报 告 人: 吴 金 随.
点击输 入标题 点击输入说明性文字.
國際志工海外僑校服務 越南 國立臺中教育大學 2010年國際志工團隊.
痰 饮.
學分抵免原則及 學分抵免線上操作說明會.
教 学 查 房 黄宗海 南方医科大学第二临床医学院 外科学教研室.
评 建 工 作 安 排.
“十二五”国家科技计划经费管理改革培训 概预算申报与审批 国家科学技术部 2012年5月.
“十二五”国家科技计划经费管理改革培训 概预算申报与审批 国家科学技术部 2012年5月.
首都体育学院 武术与表演学院 张长念 太极拳技击运用之擒拿 首都体育学院 武术与表演学院 张长念
合肥学院外国语言系 学年第二学期学生工作表彰大会
现行英语中考考试内容与形式的利与弊 黑龙江省教育学院 于 钢 2016, 07,黄山.
第5讲:比较安全学的创建 吴 超 教授 (O)
彰化縣西勢國小備課工作坊 新生入學的班級經營 主講:黃盈禎
重庆市西永组团K标准分区基本情况介绍.
西貢區歷史文化 清水灣 鍾礎營,楊柳鈞,林顥霖, 譚咏欣,陳昭龍.
所得稅扣繳法令與實務 財政部北區國稅局桃園分局 102年12月19日 1 1.
角 色 造 型 第四章 欧式卡通造型 主讲:李娜.
走进校园流行 高二15班政治组 指导老师:曾森治老师.
医院文化建设 广东省中医院 2011年3月26日.番禺.
案例:海底捞模式 ——把服务做到极致.
医疗法律法规培训 连云港市东辛农场医院 周卫平 二0一四年十二月.
史泰博出货检验员面试中·········
09英本2班 罗芬.
个人所得税 扣缴申报表填报讲解.
主講人:孫台義 教授 哈薩克大學國際關係學院 客座教授
土地增值税清算业务培训 主讲人:吴金娟 怀集地税.
实训报告 财务管理二班 第三小组 组长:董文芳 执笔人:王瑾 组员:汲伦 庞宁宁 姜美.
义务教育英语(7—9年级) 教学指导意见.
Http://
資源中心辦理補救教學之推動重點 服務單位:國立新竹教育大學 演 講 者:林志成教授.
增值税相关知识 莱西市国家税务局 刘冬梅.
流通业务外包的实践与思考 魏育辉 北京工业大学图书馆 2012年5月31日.
项目二 站姿、蹲姿、坐姿.
怎样吃饭有礼貌? ——商务宴会礼仪培训 2014年7月24日.
新 编 报 关 实 务 (第二版) 新世纪高职高专教材编审委员会 组编 主编 肖立秋 侯伟强 李 坪 新世纪高职高专
LSVT companion speech rehabilitative treatment.
Presentation transcript:

LSVT Voice Rehabilitation 高維度資料分析-期末報告 姓名:陳彥辰 指導老師:吳漢銘老師 系級:統計系碩一

資料介紹 EDA 分析目的 分析方法 結論 目錄 這是我的目錄,包含有資料介紹、EDA、分析方法以及結論

Lee Silverman Voice Treatment (LSVT) -資料說明 資料大小:126筆*314變數 變數: Response:1=acceptable(有效), 2=unacceptable(無效)。 分別有42和84筆 Subject_index :受試者編號。 Age:年齡。 Gender: 0->Male(男性), 1->Female(女性) 。 Jitter->F0_abs_dif、……、 det_TKEO_std4_10_coef:為多 種生物醫學語音信號。 Lee Silverman Voice Treatment (LSVT) -資料說明 在說明LSVT資料前,我先帶大家來了解此資料產生的背景,LSVT是一種修復發音受損的療程,此資料的產生原因是想要了解這個LSVT療程是否對患有帕金森氏疾病的患者有效,因為帕金森氏疾病的患者通常會有聲帶受損情況,所以他們找來了14位患有帕金森氏疾病的受試者來做研究,每個受試者會做由音量(大聲、適中、小聲)和音調(高頻、低頻、中頻)所組成得九種不同的發音,並利用生物醫學語音信號經由專家的評估判別患者經過療程之後聲音是否復原。所以這邊的樣本數是14*9共有126個,以及314個變數。其中這314個變數包含我們的目標變數Response,1表示這個發音是正常的可以被接受,2表示這個發音不正常不可以被接受再來是受試者編號、性別、年齡、以及最重要的生物醫學語音資訊,因為太多了這裡就不一一列出。

Exploratory Data Analysis (EDA-探索式資料分析) 在分析資料之前,我們首先要做的探索性資料分析,使我們了解資料基本內容,以利之後的分析。 由圓餅圖我們可以看到男性在此資料中佔了百分之57女性占了百分之43,再來看年齡的次數分配圖,年齡距離從51到69歲,其中51、62、67、68歲出現的次數較多。 57% 43%

分析目的 主要是在探討說哪一種分析方法可以最有效的幫助我們了解這個療程是否有效,以下我會介紹幾種分析方法,最後再進行比較。

流程圖 原始資料 heatmap LCMC heatmap LCMC MDS 交叉驗證 MDS 交叉驗證 ISOMAP SVM ISOMAP 標準化資料 挑選100變數 heatmap LCMC heatmap LCMC MDS 交叉驗證 MDS 交叉驗證 這是我的流程圖,首先我將原始資料做標準化,因為原始資料中他的每個變數差異太大,從0.0001到100、200的都有,會對我以下要做的分析有影響,所以我將它做標準化,再來是我挑選100個變數,來與未經過變數挑選的標準化資料做比較。首先我要先介紹的是heatmap、MDS和ISOMAP。 ISOMAP SVM ISOMAP SVM

Heatmap (熱圖) heatmap是一種將數據利用顏色來表示其內容,以這個圖為例子,最右邊有一個顏色條,表示顏色越深的地方代表那些區塊的值較低,越淺的地方表示區塊的值越高,heatmap的優點就是不用去數數值高低,只要看顏色便能比較大小。

Multidimensional Scaling (MDS-多元尺度法) MDS又稱多元尺度,是一種非線性的降維方法,讓高維度的資料能夠以低維度的狀態來呈現資料,在r中可以設定我們需要的維度,我這裡使用的距離我是以1減資料轉置之後取相關係數再乘以2最後再開根號的方式來計算。 多維縮放(MDS)是一種可視化數據集個別情況的相似度的方法。 它指的是一套用於信息可視化的相關排序技術,特別是顯示距離矩陣中所包含的信息。 這是非線性降維的一種形式。   MDS算法旨在將每個對象放置在N維空間中,以便盡可能保留對象間的距離。 每個對象然後被分配N個維度中的每一個的坐標。   MDS圖N的維數可以超過2,並且被預先指定。   選擇N = 2可以優化二維散點圖的對象位置[1]。 距離公式:歐式距離

Isometric Feature Mapping (ISOMAP-等軸距特徵映射) Isomap也是一種非線性降維方法,同樣也是利用距離公式再經過相鄰的鄰居個數,而鄰居個數是我們可以自行設定的,將非線性圖形依照相同排序變成平面圖型。也就是說A圖從紅色、綠色、藍色的順序,經過ISOMAP的轉換變成B圖,但他的顏色順序並不會因為維度縮減而改變他的順序。

Heatmap(熱圖) 接下來我們來比較標準化過後的資料Heatmap與挑選一百變數的heatmap,我這邊的設定是值越低越接近綠色,中間值為黑色,值越高越接近紅色,左邊的條列紅色為目標變數類別是可接受的,綠色為不可接受的。以挑選100變數資料的heatmap圖來說,圖中這塊紅色表示的是這些語音資訊變數對於分類為可接受的相關性高。

MDS 接者,我們來比較MDS圖,其中紅1表示為可接受的,藍2表示為不可接受的,我們發現兩個資料的MDS圖,他的可接受的類別都聚集在左下角,不論是標準化後的資料還是挑選100變數出來的結果都不是很理想可接受與不可接受的類別並沒有明顯分開,但還是可以比較出挑選100變數比沒有挑選的來得好。

ISOMAP ISOMAP上的線條為之前提過的鄰居,這邊設定鄰居數為5,也就是說一個點會找出五個與他最近的點並且做連線,標準化後的資料與挑選100變數的資料結果都不甚理想,也是挑選100變數的結果稍好。

流程圖 原始資料 heatmap LCMC heatmap LCMC MDS 交叉驗證 MDS 交叉驗證 ISOMAP SVM ISOMAP 標準化資料 挑選100變數 heatmap LCMC heatmap LCMC MDS 交叉驗證 MDS 交叉驗證 接下來我將介紹LCMC與交叉驗證 ISOMAP SVM ISOMAP SVM

LCMC 交叉驗證 標準化 K=5 K=6 K=7 K=8 K=9 K=10 MDS 0.1283 0.1240 0.1231 0.1285 0.1291 0.1383 ISOMAP 0.1398 0.1379 0.1374 0.1335 0.1486 LCMC 交叉驗證 挑選100變數 K=5 K=6 K=7 K=8 K=9 K=10 MDS 0.2489 0.2721 0.2977 0.3199 0.3274 0.3438 ISOMAP 0.2758 0.2774 0.2909 0.3031 0.3213 0.3256 LCMC為衡量維度縮減的效果好壞,其值越高越好,k同樣設定為鄰居數,不論是標準化資料還是挑選變數後的資料,鄰居數越多LCMC就越大。在標準化的資料中,MDS鄰居數取10的LCMC值最大,在挑選100變數的時候也同樣是MDS鄰居數為10的LCMC值最大。 接著介紹交叉驗證,我們要建立SVM模型之前,必須先建立訓練集資料以及測試集資料,將原始資料分成10分,每次取其中一份當他的測試集資料,其餘的則為訓練集資料,並計算出他的錯誤率,此動作會重複十次,最後我會將他10次錯誤率做一個平均。 Higher values mean a better performance of the dimensionality reduction.

流程圖 原始資料 heatmap LCMC heatmap LCMC MDS 交叉驗證 MDS 交叉驗證 ISOMAP SVM ISOMAP 標準化資料 挑選100變數 heatmap LCMC heatmap LCMC MDS 交叉驗證 MDS 交叉驗證 最後介紹的是剛剛有提到的SVM。 ISOMAP SVM ISOMAP SVM

Support Vector Machine (SVM-支持向量機)

1 2 3 4 5 6 7 8 9 10 Error.rate 0.2308 0.1429 0.1538 0.0833 0.1667 0.0769 SVM- 標準化資料 錯誤率平均值:0.12519 MDS 1 2 3 4 5 6 7 8 9 10 Error.rate 0.3077 0.2143 0.0833 0.3333 0.5 0.25 0.3846 0.1538 錯誤率平均值:0.40026 ISOMAP 1 2 3 4 5 6 7 8 9 10 Error.rate 0.3077 0.3571 0.25 0.3846 0.3333 0.5833 0.1667 0.1538 錯誤率平均值:0.32544

1 2 3 4 5 6 7 8 9 10 Error.rate 0.1538 0.1429 0.0833 0.25 0.1667 0.2307 SVM- 挑選100變數 錯誤率平均值:0.1335 MDS 1 2 3 4 5 6 7 8 9 10 Error.rate 0.0769 0.2142 0.2308 0.0833 0.3333 0.1667 0.1538 0.3077 錯誤率平均值:0.165 ISOMAP 1 2 3 4 5 6 7 8 9 10 Error.rate 0.1538 0.2143 0.0833 0.25 0.1667 0.2308 錯誤率平均值:0.17335

SVM- 維度錯誤率比較 最後我們來比較在各種不同的維度之下,MDS和ISOMAP的錯誤率會如何變化,先看左邊的圖示標準化資料,發現在維度為3時,除了為縮減未縮減維度的錯誤率最小之外,再來就MDS的錯誤率,有明顯的下降。 在看挑選100變數之後的錯誤率,在維度4時MDS與ISOMAP錯誤率幾乎相等,但在維度4之後ISOMAP的錯誤率明顯比MDS來得低。 整體來說是標準化之後的資料較好。 若想要對此資料作分析時,將資料標準化,一開始先不要做任何的變數刪減,再去做MDS或ISOMAP,判別的效果較好。

結論 挑選100變數ISOMAP的鄰居數為10的LCMC值最大。 標準化資料中沒有做維度縮減的錯誤率最小。 挑選100變數資料中沒有作為度縮減的錯誤率最小。 挑選100變數資料的ISOMAP維度為7、8的錯誤率最低。 結論

THANK YOU