Tamkang University Data Mining 資料探勘

Slides:



Advertisements
Similar presentations
網站經營心得分享 林文宗 明新科技大學資管系助理教授 麟瑞科技顧問 工研院資通所無線通訊技術組顧問 明新科技大學電算中心網路組組長 國立清華大學資訊工程學系博士.
Advertisements

陳春賢 老師 長庚大學 資管系 報告人 : ( 研究方向、成果與計畫 ) 資料探勘與生醫資訊相關研究 ( 研究方向、成果與計畫 )
密云季庄小 学心理讲座 合理情绪 幸福生活 武金红 密云教研中心.
第一章 会计信息系统 第一节 计算机会计概述.
2011年10月31日是一个令人警醒的日子,世界在10月31日迎来第70亿人口。当日凌晨,成为象征性的全球第70亿名成员之一的婴儿在菲律宾降生。 ?
Some Knowledge of Machine Learning(1)
初级会计实务 第八章 产品成本核算 主讲人:杨菠.
中考阅读 复习备考交流 西安铁一中分校 向连吾.
交通事故處置 當事人責任與損害賠償 屏東縣政府警察局交通隊.
CH3 關聯規則 授課老師:簡禎富 講座教授 簡禎富、許嘉裕©2014 著作權所有.
教學大綱設計 師資培育中心 林明煌.
中央广播电视大学开放教育 成本会计(补修)期末复习
Case Study for Information Management 資訊管理個案
人際溝通 Interpersonal Communication
資訊管理 第三章 數位化企業.
小学数学知识讲座 应用题.
大數據行銷研究 Big Data Marketing Research
倒装句之其他句式.
数据仓库与数据挖掘 复习.
資訊管理 第九章 資料採礦.
第 22 课 孙中山的民主追求 1 .近代变法救国主张的失败教训: “师夷之长技以制 夷”“中体西用”、兴办洋务、变法维新等的失败,使孙中山
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2014 Fall 1.
Supplement Data Mining 工具介紹 楊立偉教授 台灣大學工管系 2015 Fall 1.
Data Mining 資料探勘 個案分析與實作四 (SAS EM 迴歸分析、類神經網路):
第二章 資訊管理的應用系統.
应用SAS/EM进行数据挖掘 赛仕软件研究所(上海)有限公司.
金融数据挖掘和商业数据挖掘 建构信用卡评分模型之商业智能流程
Knowledge Engineering & Artificial Intelligence Lab (知識工程與人工智慧)
Data Mining 工具介紹 (Weka+JDBC)
資料探勘-案例期末報告 SQL Server 2008 Analysis Service
Special Topics in Social Media Services 社會媒體服務專題
巨量資料分析與應用 (1) 楊立偉教授 台大工管系暨商研所 2014 Fall.
Data Mining 工具介紹 (Weka/R + ODBC)
Endnote書目管理軟體-初階.
The Issue of Information Security Management 資安管理專題
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
Instructor:Po-Yu Kuo 教師:郭柏佑
Data Mining 第八組 B 萬佳育 B 葉書蘋.
OpenID與WordPress使用說明
國立東華大學試題 系所:資訊管理學系 科目:資料庫管理 第1頁/共4頁
物联网数据处理 第一讲 数据处理基本概念 刘进军 QQ:
Case Study for Information Management 資訊管理個案
生物統計 1 課程簡介 (Introduction)
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2018.
UEE3504: Introduction to Communication Systems
電子商務安全 Secure Electronic Commerce
MyiLibrary® ‘Search & View’ Website Training
資訊安全概論 Introduction to Information Security
Course 4 分類與預測 Classification and Prediction
人際溝通 Interpersonal Communication
第十章 線上行銷研究.
主講人:陳鴻文 副教授 銘傳大學資訊傳播工程系所 日期:3/13/2010
chapter5員工教育訓練 第一節 教育訓練之意義重要性及方法 第二節 企業大學蔚為風尚 第三節 教育訓練計畫四大程序與對員工學習原則
第 10 章 專家系統與智慧型資料庫 2019/4/26.
A Data Mining Algorithm for Generalized Web Prefetching
Case Study for Information Management 資訊管理個案
資訊數位服務 Information Service
常見的巨量資料分析與應用 楊立偉教授 台大工管系暨商研所 2017.
人際溝通 Interpersonal Communication
SQL語法教學 2015/10/15 John.
MyiLibrary® ‘Search & View’ 使用指南
数数据的基本操作 电子工业出版社.
MyiLibrary® ‘Search & View’ Website Training
MyiLibrary® ‘Search & View’ 使用指南
第六課 (1) 股市分析 - K線圖的繪製與應用 (2) 規劃求解(3) 分析藍本
商業智慧實務 Practices of Business Intelligence
淡江大學資訊管理系 戴敏育 Min-Yuh Day
畢氏定理(百牛大祭)的故事 張美玲 製作 資料來源:探索數學的故事(凡異出版社).
Case Study for Information Management 資訊管理個案
主 講 人: 任 立 中 博士 國立臺灣大學管理學院國際企業學系暨研究所副教授
Presentation transcript:

Tamkang University Data Mining 資料探勘 個案分析與實作二 (SAS EM 關連分析):Case Study 2 (Association Analysis using SAS EM) 1022DM06 MI4 Wed, 6,7 (13:10-15:00) (B216) Min-Yuh Day 戴敏育 Assistant Professor 專任助理教授 Dept. of Information Management, Tamkang University 淡江大學 資訊管理學系 http://mail. tku.edu.tw/myday/ 2014-03-26

課程大綱 (Syllabus) 週次 (Week) 日期 (Date) 內容 (Subject/Topics) 1 103/02/19 資料探勘導論 (Introduction to Data Mining) 2 103/02/26 關連分析 (Association Analysis) 3 103/03/05 分類與預測 (Classification and Prediction) 4 103/03/12 分群分析 (Cluster Analysis) 5 103/03/19 個案分析與實作一 (SAS EM 分群分析): Case Study 1 (Cluster Analysis – K-Means using SAS EM) 6 103/03/26 個案分析與實作二 (SAS EM 關連分析): Case Study 2 (Association Analysis using SAS EM) 7 103/04/02 教學行政觀摩日 (Off-campus study) 8 103/04/09 個案分析與實作三 (SAS EM 決策樹、模型評估): Case Study 3 (Decision Tree, Model Evaluation using SAS EM)

課程大綱 (Syllabus) 週次 (Week) 日期 (Date) 內容 (Subject/Topics) 9 103/04/16 期中報告 (Midterm Project Presentation) 10 103/04/23 期中考試週 (Midterm Exam) 11 103/04/30 個案分析與實作四 (SAS EM 迴歸分析、類神經網路): Case Study 4 (Regression Analysis, Artificial Neural Network using SAS EM) 12 103/05/07 文字探勘與網頁探勘 (Text and Web Mining) 13 103/05/14 海量資料分析 (Big Data Analytics) 14 103/05/21 期末報告 (Final Project Presentation) 15 103/05/28 畢業考試週 (Final Exam)

Web Site Usage Associations 個案分析與實作二 (SAS EM 關連分析): Case Study 2 (Association Analysis using SAS EM) Web Site Usage Associations

網站使用行為關聯分析

案例情境 ABC音樂廣播電台為了服務更多聽眾,設置了電台網站,讓更多的線上聽眾也可以透過網站服務以隨時掌握電台的各個節目資訊,網站提供了流行音樂趨勢(music streams)、音樂下載(podcasts)、新聞訊息(news streams)、線上收聽(live Web )以及歷史節目收聽(archives)等服務功能頁面。 分析人員想要藉由關聯分析以進一步了解線上聽眾的使用行為,做為網站服務功能更新的依據。 分析樣本為撈取近兩個月約150萬筆的客戶交易資料。 Source: SAS Enterprise Miner Course Notes, 2014, SAS

資料欄位說明 資料集名稱: webstation.sas7bdat ARCHIVE 廣播節目回顧 EXTREF 好站相連 LIVESTREAM 熱門節目收聽 MUSICSTREAM 流行音樂區 NEWS 最新消息 PODCAST 音樂下載 SIMULCAST 同步收聽 WEBSITE 首頁 Source: SAS Enterprise Miner Course Notes, 2014, SAS

網站使用行為關聯分析實機演練 分析目的 依據使用者網站交易資料,利用關聯分析演算方法產生網站使用行為關聯規則。 演練重點: • 產生關聯分析資料集 • 進行關聯分析 • 關聯分析結果解釋 Source: SAS Enterprise Miner Course Notes, 2014, SAS

關聯分析衡量的機率統計值— Support & Confidence A B C D E B C E Rule A  D C  A A  C B & C  D Support 2/5 1/5 Confidence 2/3 2/4 1/3 Source: SAS Enterprise Miner Course Notes, 2014, SAS

Support & Confidence 高的關聯規則就一定是有用的規則? Checking Account No Yes 4,000 500 3500 No Saving Account 6,000 1000 5000 Yes 10,000 Support(SVG  CK) = 50%=5,000/10,000 Confidence(SVG  CK) = 83%=5,000/6,000 Expected Confidence(SVG  CK) = 85%=8,500/10,000 Lift (SVG  CK) = Confidence/Expected Confidence = 0.83/0.85 < 1 Source: SAS Enterprise Miner Course Notes, 2014, SAS

關聯分析衡量的機率統計值— Lift增益值 信心水準最高的就是最好的規則? 「如果 Saving account 則 Checking account」這個規則的發生機率 比單獨計算Checking account的發生機率還低。 增益值(Lift): 一條規則在預測結果時能比 隨機發生的機會好多少。 Lift (SVG  CK) = Confidence/Expected Confidence = 0.83/0.85 < 1 Source: SAS Enterprise Miner Course Notes, 2014, SAS

Support (AB) Confidence (AB) Expected Confidence (AB) Lift (AB)

Support (A B) = P(A  B) Confidence (A B) = P(B|A) A與B 共同出現次數/總交易次數 Count(A&B)/Count(Total) Confidence (A B) = P(B|A) Conf (A  B) = Supp (A  B)/ Supp (A) A與B 共同出現次數/A出現的次數 Count(A&B)/Count(A) Expected Confidence (AB) = Support(B) Count(B) Lift (A  B) = Confidence (AB) / Expected Confidence (AB) Lift (A  B) = Supp (A  B) / (Supp (A) x Supp (B)) Lift (Correlation) Lift (AB) = Confidence (AB) / Support(B)

Lift (AB) Lift (AB) = Confidence (AB) / Expected Confidence (AB) = Confidence (AB) / Support(B) = (Supp (A&B) / Supp (A)) / Supp(B) = Supp (A&B) / Supp (A) x Supp (B) Lift 增益值 (提升值) Lift (AB) = 2 表示 AB 這條規則的增益值為 2, 代表已知在買A的前題下又買B的機率, 比直接買B 的機率提升 (增益)了2倍。

「買芭比娃娃就會買糖果」 你的行銷策略如何? 把兩項商品擺在一起 特意把兩項商品擺在相距較遠的地方 將糖果和芭比娃娃組合起來一起賣 糖果+芭比娃娃+銷售較差的商品一起組合銷售 定價策略:提供一個單價,降低另一個商品價格 廣告策略:芭比娃娃和糖果不需要同時廣告活動 產品設計:設計芭比娃娃形狀的糖果 提供芭比娃娃的配件,提升銷售 Source: SAS Enterprise Miner Course Notes, 2014, SAS

我的資料適合進行 購物籃分析嗎? D A B Source: SAS Enterprise Miner Course Notes, 2014, SAS

SAS Enterprise Miner (SAS EM) Case Study Step 1. 新增專案 (New Project) Step 2. 新增資料館 (New / Library) Step 3. 建立資料來源 (Create Data Source) Step 4. 建立流程圖 (Create Diagram) SAS EM SEMMA 建模流程

Download EM_Data.zip (SAS EM Datasets) http://mail.tku.edu.tw/myday/teaching/1022/DM/Data/EM_Data.zip http://mail.tku.edu.tw/myday/teaching.htm

Upzip EM_Data.zip to C:\DATA\EM_Data

Upzip EM_Data.zip to C:\DATA\EM_Data

VMware Horizon View Client softcloud.tku.edu.tw SAS Enterprise Miner

SAS Enterprise Guide (SAS EG)

SAS EG New Project

SAS EG Open Data

SAS EG Open webstation.sas7bdat

webstation.sas7bdat

webstation.sas7bdat

SAS Enterprise Miner 12.1 (SAS EM)

SAS EM 資料匯入4步驟 Step 1. 新增專案 (New Project) Step 2. 新增資料館 (New / Library) Step 3. 建立資料來源 (Create Data Source) Step 4. 建立流程圖 (Create Diagram)

Step 1. 新增專案 (New Project)

Step 1. 新增專案 (New Project)

Step 1. 新增專案 (New Project)

SAS Enterprise Miner (EM_Project2)

Step 2. 新增資料館 (New / Library)

Step 2. 新增資料館 (New / Library)

Step 2. 新增資料館 (New / Library)

Step 2. 新增資料館 (New / Library)

Step 2. 新增資料館 (New / Library)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source) DatabaseName.TableName LibraryName.TableName EM_LIB.WEBSTATION

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source) Data Source Attribute Role: Transaction

Step 3. 建立資料來源 (Create Data Source)

Step 3. 建立資料來源 (Create Data Source)

Step 4. 建立流程圖 (Create Diagram)

Step 4. 建立流程圖 (Create Diagram)

Step 4. 建立流程圖 (Create Diagram)

SAS Enterprise Miner (SAS EM) Case Study Step 1. 新增專案 (New Project) Step 2. 新增資料館 (New / Library) Step 3. 建立資料來源 (Create Data Source) Step 4. 建立流程圖 (Create Diagram) SAS EM SEMMA 建模流程

案例情境模型流程

樣本資料匯入 (Sample)

EM_Lib.Webstation

樣本資料匯入 (Sample) Edit Variable

樣本資料匯入 (Sample) Edit Variable - Explore …

樣本資料匯入 (Sample) Edit Variable - Explore …

Explore - Association

關聯分析 (Association Analysis)

關聯分析 (Association Analysis)

關聯分析 (Association Analysis)

關聯分析 (Association Analysis)

關聯分析 (Association Analysis)

關聯分析 (Association Analysis)

關聯分析 (Association Analysis)

關聯分析 (Association Analysis) Support : 1% (Minimum Support = 1%)

關聯分析 (Association Analysis)

關聯分析 (Association Analysis)

關聯分析 (Association Analysis) 檢視/規則/規則表格 (Rules Table)

關聯分析 (Association Analysis) Association Rules - 規則表格 (Rules Table)

關聯分析 (Association Analysis) Association Rules - 規則表格 (Rules Table)

關聯分析 (Association Analysis) 檢視/規則/連結圖形 (Link Graph)

關聯分析 (Association Analysis) 連結圖形 (Link Graph)

關聯分析 (Association Analysis) Maximum Number of Items: 3000000

關聯分析 (Association Analysis)

關聯分析 (Association Analysis) Association Rules - 規則表格 (Rules Table)

關聯分析 (Association Analysis) 連結圖形 (Link Graph)

Reference Jim Georges, Jeff Thompson and Chip Wells, Applied Analytics Using SAS Enterprise Miner, SAS, 2010 SAS Enterprise Miner Course Notes, 2014, SAS SAS Enterprise Miner Training Course, 2014, SAS SAS Enterprise Guide Training Course, 2014, SAS