Download presentation
Presentation is loading. Please wait.
1
陳春賢 老師 長庚大學 資管系 報告人 : ( 研究方向、成果與計畫 ) 資料探勘與生醫資訊相關研究 ( 研究方向、成果與計畫 )
2
2 Instructor Information 姓名 : 陳春賢 Ph.D. from Iowa State University, USA M.S. from Iowa State University, USA B.E. from 新竹清華大學 Research interests: Data Mining, Computational Intelligence, Biomedical Informatics Technical specialty: Databases and Intelligent Decision Support Systems
3
3 資管 vs. 資工 Business, Industry (Science) Algorithm Methodology System 資工 資管 Hardware (Electronic) Application Domain (Service) Application Domain (H/W) IT, S/W (Automation)
4
4 個人的相關研究方向 Data Mining (Data + Mining) Data Domain(Business/Industry/Science) Major source : Biological/Medical Data Minor source : Manufacturing/Financial data Mining technique(IT Algorithm/System) Classification Cluster analysis Association rule mining Evolutionary computing/Optimization Biomedical informatics Biological/Medical Data + IT (especially data mining)
5
5 Relevant Data Data Preprocessing Data Mining Evaluation/PresentationPatterns Knowledge Databases Steps in KDD Process (Technically) Data mining The core step of KDD process
6
6 Main Steps of a KDD Process (Fully) Domain knowledge Acquisition –Learning relevant prior knowledge and goals of application Data collection and preprocessing (may take 60% of effort!) –Data selection and integration : creating a target data set –Data cleaning, data transformation, and data reduction Data mining –Choosing functions of data mining association, classification, clustering, regression, summarization. –Choosing the mining algorithm(s) –Searching for patterns of interest Pattern evaluation and knowledge presentation –removing redundant patterns, transformation, visualization, etc. Use of discovered knowledge
7
7 Software Tools for Data Mining WEKA 3.x (Open DM software in Java) http://www.cs.waikato.ac.nz/ml/weka/ Matlab toolboxes Neural network Fuzzy system PolyAnalyst GeneCluster (free visual clustering tool) Excel Java, VB, C, C++, ASP, PHP
8
8 Datasets on Internet for Mining UCI Machine Learning Repository http://www1.ics.uci.edu/~mlearn/MLRepository.html DASL http://lib.stat.cmu.edu/DASL/Datafiles/ JSE Data Archive http://www.amstat.org/publications/jse/jse_data_archive.html KDNuggets http://www.kdnuggets.com/datasets/index.html MLnet Online Information Service http://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.html
9
9 Books and Journals for Research Han, J. and Kamber, M., Data Mining : Concepts and Techniques, Morgan Kaufmann Publishers, San Francisco, CA, USA, 2007. Piatetsky-Shapiro, G. and Frawley, W. J., Knowledge Discovery in Databases. AAAI/MIT Press, 1991. Fayyad, U. M., Piatetsky-Shapiro, G., Smyth, P., and Uthurusamy, R., Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, 1996. Bioinformatics, Nature, Science, PNAS
10
10 Where to Find DM References? Google Scholar, Google, Citeseer, PubMed Data mining and KDD –Conference proceedings: KDD, PKDD, PAKDD, etc. –Journal: Data Mining and Knowledge Discovery AI and Machine Learning –Conference proceedings: Machine learning, AAAI, IJCAI, etc. –Journals: Machine Learning, Artificial Intelligence, etc. Statistics –Conference proceedings: Joint Stat. Meeting, etc. –Journals: Annals of statistics, etc. Database –Conference proceedings: ACM-SIGMOD, ACM-PODS, VLDB, ICDE, EDBT, –Journals: ACM-TODS, J. ACM, IEEE-TKDE, JIIS, etc.
11
11 專利 – 慢性疾病自我健康照護諮詢系統 – 慢性疾病健康照護知識管理系統及自我健康照護諮 詢系統 健康生活型態諮詢系統 中西醫腦中風診察指標於預後分析 冠心症偵測模型 蛋白質磷酸化序列叢集分析圖譜呈現系統 蛋白質磷酸化序列階層式叢集分析樹狀結構子葉排序之 最佳化 近年在生醫資訊方面的研究成果 (資料探勘技術在生物醫學領域的應用)
12
代謝症候群早期 ( 一高、二高 ) ( 約 40 歲出現 ) 代謝症候群 ( 三高 ) ( 約 50-60 歲出現 ) 慢性疾病 ( 約 60 歲以上 ) ( 糖尿病、高血壓、高血脂 ) 慢性疾病併發症 ( 中風、冠心症、截肢、失明、洗腎 ) 12 慢性疾病健康促進與照護服務的 e 化 代謝症候群 健康生活型態諮詢系統 醫療院所健康諮詢與追蹤 代謝症候群 健康生活型態諮詢系統 醫療院所健康照護服務 居家自我健康照護諮詢系統 ( 併發症預防諮詢與緊急狀況諮詢 ) 醫療院所健康照護服務 生理訊號監控處理資訊系統 ( 併發症預防諮詢與緊急狀況諮詢 ) 晚期 早期 年老退化年老退化 健康照護方式 健康惡化階段
13
代謝症候群健康生活型態諮詢系統 ( 首頁 )
14
14 慢性疾病自我健康照護專家諮詢系統架構 ( 針對慢性疾病亞健康者的居家自我照護 ) 疾病模組與 諮詢主題可 漸進延伸 在地化知識可複製普及應用 Web-based 可多人、隨 時隨處 居家行動 隨時隨處 健康促進、 生活獨立性 資訊人員無 須涉入知識 庫管理
15
15 代謝症候群健康生活型態諮詢系統 居家自我健康照護諮詢系統 使用者 : – 代謝症候群與潛在代謝症候群患者 ( 三高初期患者 ) – 慢性疾病亞健康者 ( 定期回診、長時居家、潛在併發症患者 ) 目的 – 居家自我健康管理、促進與照護 – 協助自我改善代謝症候,以免成為慢性疾病患者 ( 著重血糖、血壓、血脂、膽固醇及體重控制等健康管理 ) – 促進慢性疾病亞健康者自我健康照護能力 協助自我居家預防慢性病併發症,以免成為重症患者 增進生活獨立性 減低家庭與健康照護人員負擔、降低健康照護成本 – 提供慢性疾病重症照護者健康照護諮詢
16
16 慢性疾病健康照護知識管理系統 使用者 – 健康照護專家 ( 醫護人員、營養衛教師 、文字圖片人員等 ) 目的 – 管理代謝症候群與各慢性疾病自我健康照護諮詢知識庫 高血糖、高血壓、高血脂、高膽固醇、糖尿病、冠心症、中風等 – 管理各自我健康照護諮詢流程邏輯知識庫 突發健康異常狀況暫時緩解的自我解決方案諮詢知識 居家機能強化自我復健的諮詢知識 居家自我健康促進的諮詢知識 併發症預防的諮詢知識 生活起居、飲食、衛教、運動的諮詢知識
17
17 健康照護諮詢的樹狀流程邏輯範例 (COPD) ( 慢性阻塞性肺疾病 ) 一問一答的諮詢流程 樹狀、結構化的諮詢流程
18
18 慢性疾病自我健康照護諮詢系統
19
19 慢性疾病自我健康照護諮詢系統
20
20 慢性疾病自我健康照護諮詢系統
21
21 (資料探勘技術在中西醫資料的應用) 整合中西醫腦中風診察指標於預後分析 (資料探勘技術在中西醫資料的應用) 協助建立具備台灣地區特性的 中醫腦中風診療 ( 協助中醫在腦中風診察的科學化 ) Research Aim
22
22 Research Design 中風病患群 中醫診斷資料 西醫診斷資料 叢集分型 叢集分型 中醫診斷 西醫診斷 預後整合分析 具區別力的診斷標準項目
23
2016年8月27日星期六 2016年8月27日星期六 2016年8月27日星期六 Introduction to Data Mining 23 2016年8月27日星期六 2016年8月27日星期六 2016年8月27日星期六 Main Data Mining Techniques for Biomedical Informatics 23 Profiles of Stroke Patients ( 根據中醫腦中風診察指標 )
24
2016年8月27日星期六 2016年8月27日星期六 2016年8月27日星期六 Introduction to Data Mining 24 2016年8月27日星期六 2016年8月27日星期六 2016年8月27日星期六 Main Data Mining Techniques for Biomedical Informatics 24 A Decision Tree for CAD Detection (Constructed from ~500 Records)
25
蛋白質磷酸化序列叢集分析圖譜呈現系統 ( 子群集趨勢呈現與比較 ) 點選相鄰子群集 點選屬於不同父群集的子群集
26
26 蛋白質磷酸化序列階層式叢集分析圖譜呈現系統 ( 整體與局部趨勢的呈現 ) A B C D E
27
27 蛋白質磷酸化序列階層式叢集分析樹狀結構 子葉排序之最佳化 ( 呈現隱藏的趨勢 )
28
28 應用模擬退火演算法於基因表現資料階層式叢集分析樹狀結構子葉排序最佳化之研究
29
29 所指導之研究生論文主題簡介 林文中, 91/7 : 調控基因的動態模型化 洪榮宏, 92/6 : 基因調控動態電腦輔助系統 尹柏元, 93/6 : 以遺傳演算法與最近鄰居分類法篩選遺傳疾病基因 黃代鈞, 93/6 : 以遺傳演算法與貝氏分類法篩選遺傳疾病的相關基因 劉建志, 94/6 : 以 Delaunay Diagram 為基礎的新型叢集分析演算法 李文慈, 94/7 : 以監督式叢集分析方式使用基因表現資料尋找癌症 子型 廖文祥, 94/7 : 應用軟式計算於臺灣股市交易時點之研究 江素倩, 94/7 : 以類神經網路預測基因的多重功能 劉永嘉, 94/7 : 關聯規則的資料倉儲化 1/6
30
30 所指導之研究生論文主題簡介 陳春成, 95/6 : 3D/VR 腦中風居家復健運動學習輔助系統之開發研究 劉家陳, 95/7 : 繪圖卡產業訂單預測模型研究 王國州, 95/7 : 進化策略與類神經網路應用於投資組合保險報酬率之 研究 - 以國內組合型基金為例 劉信偉, 95/7 : 案例式推理應用在股價型態之預測 蔡欣怡, 95/7 : 使用文字探勘技術分析疾病候選基因與基因功能註解 王美惠, 95/7 : 以序列型樣探勘技術分析轉錄因子結合區 陳韋郡, 95/7 : 利用叢集分析技術交叉驗證中西醫腦中風診療 2/6
31
31 所指導之研究生論文主題簡介 葉欽龍, 95/8 : 適性化補救教學系統之開發與驗證 — 以電腦軟體應用 丙級檢定為例 葉名峰, 96/7 : 運用加權貝氏分類法於蛋白質磷酸化位點預測 陳曠迪, 96/7 : 應用加權貝氏分類法識別 MicroRNA 的序列 黃順利, 96/7 : 以電腦輔助轉錄調控基因之篩選 吳漢城, 97/7 : 利用資料探勘分析方式於計程車執業管理之研究 ~ 以台北都會區某縣市為例 王惠慈, 97/7 : 慢性疾病居家健康照護平台之開發研究 ~ 以糖尿病為例 3/6
32
32 所指導之研究生論文主題簡介 許椀柔, 97/7 : 性別式遺傳演算法效能改善之研究 卓聖威, 97/7 : 利用互動式遺傳演算法設計個人化的減重菜單 莊婉沁, 98/7 : KTV 客戶消費習慣之研究 ~ 以台北縣市某 KTV 門市 為例 蕭光裕, 98/7 : MES 系統效能預測 ~ 以某 DRAM 晶圓製造廠為例 呂悅晴, 98/7 : 以基因表現資料預測家族性乳癌子分類 吳慧瑜, 98/7 : 結合關聯規則探勘、基因演算法及決策樹之方法於蛋 白質磷酸化位點預測 胡耀文, 98/7 : 腦中風復發預警系統之模式開發 4/6
33
33 所指導之研究生論文主題簡介 張健宏, 99/2 : 應用資料探勘技術分析用藥安全 : 以心房纖維顫動併 腦中風處方為例 廖俊華, 99/2 : 中西醫腦中風診察資料交叉關聯視覺化之研究 連國盛, 99/7 : 以 GHSOM 叢集分析蛋白質磷酸化序列 鍾佩陵, 99/7 : 應用自組織映射網路於蛋白質磷酸化序列資料之叢集 分析 孫詠涵, 100/2 : 建立食道癌病理報告癌症自動分期之預測模型 施威祥, 100/5 : 醫學檢驗決策支援模式應用於臨床診斷之研究 - 以心 血管疾病為例 曾帥, 100/7 : 蛋白質磷酸化序列叢集分析圖譜呈現系統 5/6
34
34 所指導之研究生論文主題簡介 許楷毅, 100/7 : 蛋白質磷酸化序列階層式叢集分析圖譜呈現系統 高偉哲, 101/7 : 蛋白質磷酸化序列階層式叢集分析樹狀結構子葉排 序 之最佳化 徐國超, 101/7 : 應用模擬退火演算法於基因表現資料階層式叢集分 析 樹狀結構子葉排序最佳化之研究 林思暐, 102/7 : 應用特徵合成與挑選機制於冠心症的辨識 陳韋炘, 102/7 : 開發蛋白質磷酸化序列趨勢分析圖譜呈現系統 楊繼展, 103/1 : 應用類神經網路於零件需求預測 - 以某自動光學檢測 設備業為例 6/6
35
35 近年生醫資訊相關的研究計畫 藉由叢集與類型交叉比對分析腦中風中、西醫診斷之對應關聯 (93/7/1 – 96/6/30, CMRP 33048) 系統生物整合型子計劃三 : 使用基因表現資料進行膀胱癌的相關基因篩選與病患識別 (93/9/1 – 96/8/30, CMRPD 33080) 使用基因微陣列晶片基因表現資料快速篩選遺傳疾病基因之研究 (93/8/1 – 94/7/31, NSC93-2213-E-182-010) 整合叢集分析與關聯法則探勘技術以探勘基因調控關係 (94/8/1 – 95/7/31, NSC 94-213-E-182-022) 1/3
36
36 新世代個人化健康資訊管理模式之研究 - 以腦血管病變病人為例 ( 子計畫二 ) :智慧型健康照護支援系統 (95/8/1 – 98/7/31, NSC) 經濟部學界科專 - 智慧型高齡者照護用臨床醫材研發 (Dr.e) (95/11/1 – 98/10/30, 經濟部 ) 整合型膀胱癌的蛋白質研究子計劃二: 膀胱癌的蛋白質轉譯後修飾作用位置與激酶分析 (96/5/1 – 99/4/30, CMRP) 類別型叢集分析方法之開發及其在蛋白質磷酸化序列分析之應 用 (98/8/1 – 99/7/31, NSC) 近年生醫資訊相關的研究計畫 2/3
37
37 整合型長庚醫療體系腦中風登錄計畫 ( 子計畫一 ) : 改善心房顫動患者抗血栓藥物服用與臨床預後 (99/5/1 – 103/1/31, CMRP) 蛋白質磷酸化序列階層式叢集分析樹葉端資料排序之最佳 化 (101/8/1 – 102/7/31, NSC) 近年生醫資訊相關的研究計畫 3/3
38
Thanks !!!! Have a Nice Day !
Similar presentations