國立高雄應用科技大學電機工程系資料探勘實驗室

Slides:



Advertisements
Similar presentations
讀經教育  第一組:吳碧霞、陳鍾仁  第二組:吳雪華、謝濰萁  第三組:邱國峰、林佳玫. 不論上智下愚 成功的教育 讓每個孩子 都能成為最優秀的人才.
Advertisements

我的心靈有氧體操 閱讀 ~ 分享人:陳秋媛 日期: 99/10/22 銘傳國中九十九學年度上學期閱讀研習.
新闻写作基础知识 一. 新闻导语 二.新闻主体 三.新闻结构 四.角度选择.
企业培训师培训(上) 王 囤 副教授.
對於學習不力學生的學習輔導經驗分享 張其清 新北市立新北高工 主任輔導教師.
公文寫作 演講人 高 文 民.
應用寫作與口語表達之一 報 導 文 學.
第五章 中国的传统伦理道德 中国是一个重视伦理道德的国家,几千年来,伦理道德思想在中国文化中居于中心地位。伦理道德不仅体现于个人的思想品德、行为规范之中,而且和国家、社会的政治生活、经济生活等各方面都有联系。
使用說明 高年級 破解賽恩思 (Science)密碼 編輯群 明湖國小 吳立明 老師 李惠雯 老師 林宜璇 老師.
国家自然科学基金项目申请 经验交流与心得体会
研討會期間敬請關機… Copyright , SPSS Taiwan Corp..
第六章 顾客购买行为分析 学习目标 了解顾客购买行为分析的模式 理解消费者购买行为的特征和类型 掌握影响消费者购买行为的因素
推論與自我提問 閱讀教學師資培訓研習營.
要SHOW才會贏 教你在生活中學企劃 救國團總團部活動處 文耀忠.
防災教育管理與資源整合 主講者:康麗娟.
加油添醋話擴寫 日新國小 鄒彩完.
【家庭生活記趣 】 ▲幫忙製作相關標題 有▲記號,請美編設計找圖案.
聰明小紅帽~ 自我身體保護 救國團新竹張老師 李 清 垣.
社区营养管理与干预 第四军医大学唐都医院 叶琳 Tel: ,
天秤失衡了… 分辨愛情警示燈 學生輔導中心.
大家好!.
【HR故事】上海通用汽车(SGM)的“九大门坎”
《解决问题能力》培训讲座.
十二年國民基本教育 高雄區入學方式說明 報告人:中山工商 楊薇主任.
數學解題王 ~從閱讀策略談起 分享者:吳祥銘老師.
研究結果的呈現.
案例研究报告撰写.
資2-6-3 能發現並討論問題 教育部增置國小圖書教師輔導與教育訓練計畫 圖書資訊利用教育教學綱要及教學設計小組
1.1 管理 管理的发端 管理的概念 管理的性质 管理的职能.
如何撰寫營運(創業)計畫書 主講人:石怡芬.
101學年度大學校院協助高中高職優質精進計畫/子計畫「產學創業企劃實務」
歡 迎 光 臨.
1、什么是工具?你能给“工具”下个定义吗? 2、您在工作、学习中都使用哪些工具? 3、您知道(或使用)的第一本工具书是什么?
國語演說的指導訓練與實務分享 桃園縣中原國小 王宣驊.
讀 報 活 動 報紙版面知多少.
在职场 礼仪指导.
信用卡資料庫管理 與顧客服務 玉山銀行 陳炳良 2002年09月
如何準備新聞採訪 國立台北大學中文系 老師:簡陳中
報告即將開始.
社團企劃書撰寫暨實際演練 巫正淵 (商務科技管理系秘書).
“差异适应性”教学子模式之语文作文 改变一点点 吴家山第三中学 八年级语文组 张向华.
義工訓練 程序設計須知.
「從紀錄片看台灣水災: 《六月初八》紀錄片巡迴影展」
全聯福利中心 資管三乙  鄭怡萍.
新闻写作刍议.
湖南农业大学 通讯的采写.
离职流程精细化标准推进材料 人事行政处.
沿途风光讲解 全国职业教育数字化资源共建共享 旅游服务与管理 W-1.
新聞報導 一、什麼是新聞? 1、狗咬人不是新聞,人咬狗才是新聞 2、大眾關切的事 3、讀者有興趣知道的事 4、接近性.
教案名稱: 社群網站的益處 本教案製作者:毛俞婷
Excellence in Manufacturing 卓 越 制 造
架構行銷企劃立案 - 架構行銷及企劃案的撰寫之道 - 一頁企劃書的魅力與撰寫
金融数据挖掘和商业数据挖掘 建构信用卡评分模型之商业智能流程
加油添醋話擴寫 鄒彩完.
校園小記者.
食記書寫教學 授課教師: 何素月 師 授課TA: 四語四甲 楊育瑄.
網頁資料知多少? 事 實 ? 謠言?.
你的顧客感到很快樂、 你不用到處救火、 你不是被動地被迫做事。 Jack Welch, comments on 6-sigma
校園小記者.
創意創新創業企劃師-乙級 創意創新創業企劃師-丙級 證照培訓檢定
102-2金融法規(2~4) ~03..
南投縣106年度 結合家長會防制學生藥物濫用宣導
南投縣106年度 結合家長會防制學生藥物濫用宣導
面試Cosplay 2015/03/31 by江宜倩.
企業導入客戶關係管理(CRM) 建置需求與期望
数据挖掘管理系统规范说明 现状简介 强度挖掘(Intension Mining) I-MIN过程模型(Process Model)
第一章 電子商務簡介 第一篇 電子商務概論篇.
行銷的三個重點 誰是我的客戶? 顧客 通路 產品.
Term Project : Requirement
第一节 计划的概念及其性质 第二节 计划的类型 第三节 计划编制过程
Presentation transcript:

國立高雄應用科技大學電機工程系資料探勘實驗室 班級:博電一甲 學號:1097404103 姓名:鍾翔航

實驗室首頁:http://dml.ee.kuas.edu.tw/

利用文件探勘技術,針對萃取癌症知識之生物資訊研究

跨語言與單一語言文件抄襲偵測之研究方法

Copyright 2003-12, SPSS Taiwan Corp. Data Mining 是什麼? Data Mining是從資料中找出有用珍貴知識的一個過程 增加銷售 交叉銷售 減少流失 降低成本 忠誠的客戶 警察找出罪犯 醫學找出疾病 國稅局找逃稅 何謂珍貴? 何謂珍貴? Why Who What When Where How 何謂過程? 何謂過程? 許多技術知識的融合(統計、人工智慧、未來的基因演算法…等),並非一個演算法就可以解決全部問題 資料 資訊 知識 將沈睡的資料中的資訊轉變為活的知識 ,進而成為決策的智慧 Copyright 2003-12, SPSS Taiwan Corp.

Copyright 2003-12, SPSS Taiwan Corp. 為什麼要做 Data Mining? 競爭日益劇烈,了解客戶需求才能佔有優勢 過去及現在和客戶互動方式的改變 過去 互動單純 直接了解客戶個人化需求 現在 互動複雜 難直接了解客戶個人化需求 電子化 Copyright 2003-12, SPSS Taiwan Corp.

Copyright 2003-12, SPSS Taiwan Corp. Data Mining 和統計不同? 統計 先假設再檢定 母體參數未知 資料量不可太大 Data Mining 沒有事先假設 多數狀況下母體參數已知 資料量越大越好,小資料也可以挖只是較不可靠 融合各種知識,包括統計、Machine Learning、人工智慧、基因等 Copyright 2003-12, SPSS Taiwan Corp.

Copyright 2003-12, SPSS Taiwan Corp. 資料採礦的定位 Business Value Measurement (historical) Prediction (future) Real-time Personalization 這些流失客戶是位於哪個地區? 我們流失了多少客戶? Data Mining OLAP 我們應該即時提供這位客戶什麼服務? Query & Reporting 哪些是高風險客戶以及原因是? Time From SPSS White Paper Copyright 2003-12, SPSS Taiwan Corp.

Copyright 2003-12, SPSS Taiwan Corp. Data Mining 的其他特徵 Interactive 互動性 Automation 電腦自動化 Continuing 連續性,是動態的 團隊分工合作 具有決策功能,使企業組織創新、再造 目標:一對一個人化(Personalize) Copyright 2003-12, SPSS Taiwan Corp.

Copyright 2003-12, SPSS Taiwan Corp. Data Mining的應用範疇 客戶關係管理(CRM) 犯罪(Criminal) 教育(Education) 醫療(Health Care) 科學研究(Research) 製程管理(Process Management) Copyright 2003-12, SPSS Taiwan Corp.

Copyright 2003-12, SPSS Taiwan Corp. 各產業的應用層面 電信業 客戶流失管理 顧客終身價值及利潤價值 行銷回應預測 交叉銷售/再銷售 電子商務 顧客終身價值 瀏覽行為分析 政府機構 員工流失管理 犯罪偵測 零售業 忠誠度及通路忠誠度 行銷回應預測 客戶產品偏好分析與鑑別 交叉銷售/再銷售 製造業 良率分析 製程改善 需求預測 醫療業 病人流失管理 潛在新病人分析 病人屬性區隔 Copyright 2003-12, SPSS Taiwan Corp.

Copyright 2003-12, SPSS Taiwan Corp. 各產業的應用層面 銀行 風險管理 行銷回應預測 維持顧客模型 顧客終身價值及利潤價值 多通路行為管理 信用卡冒用偵測 保險業 交叉通路銷售 詐欺理賠分析 生命科學 基因抗藥反應分析 基因序列分析 藥物區隔分析 藥物市場風險評估 娛樂業 客戶流失管理 目標客戶分析 客戶區隔 需求預測分析 Copyright 2003-12, SPSS Taiwan Corp.

DM處理流程 (1997年於阿姆斯特丹正式誕生CRISP-DM SIG) 2. 整合性服務 1. 資料準備 定義企業問題 資料來源檢視表 (Data Source View) 資料源 3. 資料檢視 資料源 6. 分析服務 報表服務 佈屬與應用 分析服務 (Data Mining) 4. 模型的建立 5. 模型評估

CRISP-DM Business Understanding Data Preparation Modeling Deployment Evaluation Format Integrate Construct Clean Select Determine Objectives Review Project Produce Final Report Plan Monitering & Maintenance Plan Next Steps Process Evaluate Results Assess Model Build Generate Test Design Technique Situation Explore Describe Collect Initial Data Mining Goals Verify Quality Project Plan

定義企業問題 (CRISP-DM) 確定目前內部遇到的問題 定義解決的目標是開源或是節流 電信用戶忠誠度逐年下降.. 產品良率持續下降… 零售點庫存情況成長… 保戶詐欺狀況不斷升高… 卡戶剪卡比例增加… 客戶呆帳發生數暴增… 客戶轉貸頻率提升…

模型的建立(CRISP-DM) 同一商業問題可以透過多種演算法、調整參數找出最佳模型 1.選擇建模技術 建立模型技術, 模型假設 2.規劃測試 測試計畫設計 3.建立模型 參數設定, 資料採礦模型, 模型描述 4.選擇最佳模型 模型評估, 參數重新調整

模型的評估(CRISP-DM) 建立預測模型之後, 在真正應用前, 通常會透過測試計畫來評估整個資料採礦模型能帶來的效益, 並協助檢視整個導入過程的潛在盲點, 而評估的標準並非數學上的正確度, 而是以帶給企業最大利益為考量. 1.評估結果 依專案成功要件評估結果, 核可之模型 2.流程檢視 流程檢視 3.決定下一步驟 行動列表, 決策 Lift Chart-累積增益圖 Classification Matrix-錯差矩陣

佈署與應用(CRISP-DM) 資料採礦模型整合在整個企業的決策流程,達到自動化預測的效果,以提升營運利潤、改善商業流程 1.計畫應用 應用導入計畫 2.專案監督維護 監督與維護計畫 3.結案報告 結案報告或簡報 4.檢視專案 經驗傳承及技術文件