SAS校園資料採礦競賽 IMTKU 淡江資管隊 指導老師:戴敏育 博士(Dr. Min-Yuh Day) 隊長: 杜駿(Chun Tu)

Slides:



Advertisements
Similar presentations
正規化範例 第 1 、 2 階正規化. 正規化範例 ( 水果供應商 ) 編號姓名電話地址 郵遞區 號 品名價格 001 林國鐘 高雄市 100 頻果 100 香蕉 60 鳳梨 葉連芳 台北市 400 葡萄 60 頻果 郭明正
Advertisements

說明文導論 講 師:楊宏通. 1. 說明文的內涵 1.1 一種使用頻率極高的文體 – 介紹工作方法、學習方法; – 介紹、解釋科學知識; – 介紹產品使用方法; – 介紹電影、劇情、書刊 ……
Chapter 11. 行銷管理 Chapter 11 訂價概 念 11-2 行銷管理 Chapter 11 訂價 概念 11-3.
泄 泻. 一、概述 定义: 大便稀薄,甚如水样,或完谷不化,并多 有排便次数增多。 泄与泻含义有别:泄者,漏泄之意,是指 大便溏薄,时作时止,病势较缓;泻者,倾 泻之意,是指大便直下,如水倾注,病势较 急。临床一般统称为泄泻。 病名: 《内经》称为 “ 泄 ” ,汉唐多与痢疾同归于 “ 下利 ” 之中,宋代以后渐以.
工讀生招募 Recruitment of Part-time Student
單元九:單因子變異數分析.
對於學習不力學生的學習輔導經驗分享 張其清 新北市立新北高工 主任輔導教師.
国家自然科学基金项目申请 经验交流与心得体会
高考主题讲座 高考语文 董 腾.
行銷研究 單元三 次級資料的蒐集.
台灣網路銀行網站之現況與比較 指導老師:吳有龍 A 曾馨慧.
98年度「大專畢業生創業服務方案」 U-START創業競賽營運計畫簡報(範本)
网上疯传的一条微博: 早上。买两根地沟油油条。切个苏丹红咸蛋。冲杯三聚氢氨奶。吃完开锦湖轮胎的车去上班。
鉴赏诗歌的形象.
第1章 電子商務的概念 1 電子商務的簡介 2 電子商務的構面與範圍 3 電子商務的內涵 4 結論.
有人说:“老师是塑造人类灵魂的工程师。” 有人说:“老师像蜡烛,照亮了学生前进的道路。” 有人说:“老师像梯子,载着学生攀登科学的高峰。”
Bank 3.0 證券產業發展趨勢 與數位化應用 富邦證券 副總經理 郭永宜 (行銷暨商品督導)
指導老師:李振宇 班級:工管三甲 姓名:康家齊 學號:
如何撰寫營運(創業)計畫書 主講人:石怡芬.
99年度「大專畢業生創業服務計畫」 U-START創業競賽營運計畫簡報(範本)
12年國教前哨站 談適性輔導及免試入學 12年國教前哨站 談適性輔導及免試入學 主講人:龍門國中王意蘭 校長 輔導主任 潘姿伶.
形体训练与形象塑造.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
命題技巧與實例 如何出一張好試卷 楊心國小校長葉春櫻.
从2008年度时尚先生看我们的时代精神方向.
學習行為觀察與評估 講 師:陳怡華.
第七章 公共危机管理的 决策机制 主讲教师:朱丽峰          学时:32.
第七單元 大眾運輸好方便 凡事小心才安全.
罗湖区第二届智慧杯中学政治学科小课题研究
Views ,Stored Procedures, User-defined Function, Triggers
毕业论文报告 孙悦明
Data Mining 資料探勘 個案分析與實作四 (SAS EM 迴歸分析、類神經網路):
应用SAS/EM进行数据挖掘 赛仕软件研究所(上海)有限公司.
第八章 利用SELECT查詢資料.
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
電子商務基本概念 電子商務的定義 1-1 電子商務的特性 1-2 電子商務的演進 1-3.
本講章由楊偉文博士編寫 作為香港管理專業協會 「企業管理文憑課程」授課之用 ® 2009
CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
資管所資料庫系統 -期末專案 立欣建材行進貨銷貨退貨系統
CH03 資訊管理的智慧觀點:技術篇.
指導老師:黃貞芬 老師 專題組員:B 黃育宇 B 魏志軒 B 平震宇
美國職籃勝率數據分析 指導教授:趙景明 教授 組員 :黃純偉 潘柏全 王廷剛.
大數據與我 4A 陳駿榜.
可能受益的商业活动 客户保留 目标营销 欺诈检测 购物篮分析 客户细分 客户忠诚度 信用打分 信用风险评估 营销组合管理和评估 盈利能力分析
指導老師:葉淳媛老師 組 員:施金翰 廖仁輝 李柏蔚 黃威耀 邱哲偉 張育彬 報告日期:100年12月6日
第三章 危害與操作性研究.
網頁資料知多少? 事 實 ? 謠言?.
哪些人是管理者? 管理者? 指和一群人工作,並藉由協調他人來完成工作,以便達成組織目標的人
第八單元 清晨摸黑騎鐵馬 反光配件要加碼.
學習內容 概說 損失函數 雜音:造成品質變異的原因 訊號雜音比 直交表 回應表與回應圖 田口方法.
第十章 線上行銷研究.
國立成功大學(農業) 報告人 協同主持人 林翰佑
產業實務實習工作說明 Kay Chang ASD
九十學年度實務 專題報告 指導老師: 高玉芬 老師 學生: 張駿呈 張書嘉 林正浩
認識到認同、消息轉消費,最有效的依「賴」行銷手法攻略
SQL語法教學 2015/10/15 John.
電子化企業整合 E-Enterprise Integration 張捷中 (Acer) 2014/10/02
花王集團.
Quiz1 繳交期限: 9/28(四).
Identifying your company’s real intelligence needs
甲乙己組專題討論紀要 Data Collection and Analysis of Critical Infrastructure Interdependency Relationships Dr. Chien-Cheng Chou 2012/09/26(三) 13:00~15:00 土木館5F演講廳.
Speaker : YI-CHENG HUNG
第一章 電子商務簡介 第一篇 電子商務概論篇.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
網站個案報告 參考架構 一,企業背景簡介 二,經營優勢與競爭分析 三,市場區隔與目標市場 四,行銷4P策略 五,未來發展與挑戰
營運模式.
主 講 人: 任 立 中 博士 國立臺灣大學管理學院國際企業學系暨研究所副教授
一粒貌不惊人的种子,往往隐藏着一个花季的灿烂;一条丑陋的毛虫,可能蜕(tuì)变为一只五色斑斓的彩蝶。因为,生命本身就是一桩奇迹。
CHT IPv6測試 D-Link Taiwan 友訊科技台灣分公司 TTSS 電信技術支援課 Name:
Presentation transcript:

SAS校園資料採礦競賽 IMTKU 淡江資管隊 指導老師:戴敏育 博士(Dr. Min-Yuh Day) 隊長: 杜駿(Chun Tu) 隊員: 陳維君(Wei-Chun Chen) 許安琪(An-Chi Hsu) 黃世禎(Shih-Chen Huang)

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 大綱(Outline) 管理摘要(Executive Summary) 模型建置(Model Development) 研究結果(Experimental Results and Discussions) 結論(Conclusion) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

為何作這項研究? (Why this research?) 有效運用模型技術,找出回應率高的潛在顧客名單 以同樣的行銷成本,創造玉山產品電話行銷之最大利潤 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

研究中發現什麼?(What was found) 由玉山銀行所提供的10萬筆顧客名單作為訓練資料集,並結合SAS Enterprise Miner(EM)搭配SAS Enterprise Guide(EG)建置模型預測5萬名顧客名單,本團隊提供一萬名建議行銷顧客名單,並與主辦單位提供之五萬名正確回應顧客名單做比較,本團隊之模組預測回應率高達10.75% 20% 80% 50000名顧客 1835名顧客回應 10000名顧客 2011年全年顧客 10萬顧客名單\ 來預測2012年第一季50000名顧客 1075名顧客回應 58% 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

研究發現所代表的意義? (What those findings mean) 假設: 平均行銷一名顧客的電話成本為10元。 客戶回應即成為玉山顧客(回應後不一定成為玉山顧客,有可能因部分產品條件而不購買玉山產品或是玉山可能會因為信用條件而婉拒該顧客,本專案省略此部分) 本專案僅考慮行銷時的電話成本,其餘直接成本與間接成本暫不考慮。 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

研究發現所代表的意義? (What those findings mean) 平均成功一位顧客成本所需 10/3.67%=272元 每通電話行銷成本10元 50000名顧客 回應顧客1835人 總行銷成本為50萬元 平均成功一位顧客成本所需 10/10.75%=93元 玉山銀行行銷50,000名顧客,每名電話成本10元,總行銷成本為50萬元。 顧客回應人數為1,835人(=行銷名單50,000人*回應率3.67%),總產品收益為18,350萬元(=1,835人*10萬元)。   產品利潤=總產品收益1,835人*10萬元- 50萬元= 18,300萬元 仍行銷50,000名顧客,每名電話成本10元,總行銷成本仍為50萬元。 利用我們所建置之模型所挑出的顧客行銷名單,回應率將可高達10.75%,因此顧客回應人數將為5,375人(=行銷名單50,000人*回應率10.75%)。 產品利潤=總產品收益5,375人*10萬元- 50萬元= 53,700萬元 每通電話行銷成本10元 10000名顧客 回應顧客1075人 總行銷成本為10萬元 成本節省: (272-93)/272*100%=65% 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 研究發現所代表的意義? (What those findings mean) 透過電話產品行銷,結合我們所建置的模型之回應顧客建議銷售名單,可以替公司省下65%之行銷成本 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 所採取之行動?(What action) 針對模型所挑出的顧客行銷名單,配合電話行銷人力規劃及產品設計,分批進行行銷專案。 可設計行銷頻率,例如:每半年重複一次,在不影響顧客觀感下,可提高名單的利用價值。 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建置(Model Development) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 模型建置-TIME WINDOW 圖一、模型建置之Time Window 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建置(Model Development) 決策樹(Decision Tree) 迴歸(Regression) 類神經(Neural Network) 支持向量機(SVM) 模型比較(Model Comparison) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建立(EM)-決策樹(Decision Tree) Highlight 五個變數 我們設計的衍生變數在第三個 圖二、決策樹模型 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建立(EM)-決策樹(Decision Tree) 所分枝的變數依序是 1.PRODUCT_4A(信貸正常) 2.ULC00302(全體金融機構預借現金金額) 3. ULC00303(全體金融機構上期未繳金額(循環)-截至2011年7月之未繳金額餘額) 4. CST_018(當月繳款金額) 其中前三個變數屬於衍生變數,作為決策樹分枝的依據可提升模型之預測能力 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建立(EM)-迴歸(Regression) 圖三、迴歸參數調整 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 模型建立(EM)-迴歸(Regression) 圖四、迴歸模式輸出結果 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建立(EM)-類神經網路(Neural Network) 圖五、類神經網路參數調整 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建立(EM)-類神經網路(Neural Network) 圖六、類神經網路輸出結果 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 模型建立(EM)-支持向量機(SVM) 圖七、支持向量機(SVM)參數調整 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 模型建立(EM)-支持向量機(SVM) 圖八、支持向量機(SVM)輸出結果 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建立(EM)-模型比較(Model Comparison) ROC圖,可以比較模型好壞。看得出來是類神經比較好。 圖九、模型比較-輸出結果(ROC) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

模型建立(EM)-模型比較(Model Comparison) 觀察累積增益可以了解他的LIFT提升多少。 圖十、模型比較-輸出結果(LIFT) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

研究結果(Experimental Results) 資料集與模型比較與結果 本研究依據不同變數反覆測試,整理出3筆資料集SAS_0731 (54個變數)、SAS_0801 (78個變數)以及SAS_0803 (108個變數),皆運用相同之模組與方法做行銷建議預測。各資料集之差異比較如下表: DATA SET SAS_0731 SAS_0801 SAS_0803 衍生變數+target欄位數 54 78 108 欄位相同處 顧客基本資料、預測目標變數 欄位相異處 行內行為資料 將月份整合為半年資料 將每個月份分開呈現(即是從原始資料中,由列轉為欄) 產品持有資料 無表示是否持有產品之24欄位 有表示是否持有產品之24欄位 用其中SAS_0801資料集為78個變數雖然較SAS_0803資料集108個變數少,使用SAS Enterprise Miner資料採礦技術建立預測模型卻為分析之最佳結果, SAS_0801資料表使用Neural Network (類神經)模型累積增益值為4.63,為最佳結果。 圖十一、三筆資料集差異比較表 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

研究結果(Experimental Results) 各資料表執行預測後之結果,其TRAIN累積增益數據比較如下表: MODEL\DATA SET SAS_0731 (54個變數) SAS_0801 (78個變數) SAS_0803 (108個變數) Regression (迴歸) 3.36 4.38 3.33 Decision Tree-1 (決策樹-手動自建樹) 4.09 4.41 Neural Network (類神經網路) 3.9 4.63 4.01 Decision Tree (決策樹-自動樹) 1 SVM 2.49 3.31 2.33 用其中SAS_0801資料集為78個變數雖然較SAS_0803資料集108個變數少,使用SAS Enterprise Miner資料採礦技術建立預測模型卻為分析之最佳結果, SAS_0801資料表使用Neural Network (類神經)模型累積增益值為4.63,為最佳結果。 圖十二、三種最佳模型比較表 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

研究結果(Experimental Results) 用其中SAS_0801資料集為78個變數雖然較SAS_0803資料集108個變數少,使用SAS Enterprise Miner資料採礦技術建立預測模型卻為分析之最佳結果, SAS_0801資料表使用Neural Network (類神經)模型累積增益值為4.63,為最佳結果。 圖十三、三種最佳模型比較-輸出結果(ROC) Neural Network_0801即SAS_0801資料集之Neural Network類神經模型ROC Curve為最理想之結果。由以上數據與圖表所示,因此本團隊最後決定使用SAS_0801資料集的Neural Network類神經模型為最後的決策模型。 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 結論(Conclusion) 經衍生變數評估與比較後,最終運用本小組整合衍伸後之SAS_0801資料集進行預測所提出10000筆建議銷售名單,其成交的預測機率範圍介於約0.70至0.05之間 使用SAS_0801資料集的類神經模型於預測出潛在顧客名單之回應率表現比較好 經反覆測試發現衍生變數愈多並不表示結果會愈符合預期 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 未來展望(Future Works) 未來運用本團隊之模型進行預測,若能取一萬名顧客以下之顧客即能達到理想結果,意即降低行銷成本,即能達到最佳效益,最終即可不必取一萬名而是取能達到最佳效益的顧客數量。 例如:若透過80/20法則,如果只需採用前20%人數作為建議行銷顧客名單(2000名回應顧客),希望可達到近50%以上之顧客回應率,即能大幅降低行銷成本 20% 80% 2000名顧客 50%↑ 10000名顧客 1075名顧客回應 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 前10名隊伍回應率之比較 10.75%  10.63% 10.60% 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 致謝(Acknowledgment) 感謝SAS臺灣提供一個公正而又富挑戰性的舞台的機會,各校資料採礦高手一同組隊挑戰企業實例個案 感謝玉山銀行提供機會,將在經營實際所面對的問題以及相關數據資料,提供隊伍進行資料採礦分析,深入了解如何利用所學採礦理論與企業的實際案例做結合 感謝SAS的專業顧問及玉山銀行實際操作採礦分析的專家提供請益機會,達到理論與實務的實際結合學習作用。 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊成員 戴敏育 杜駿 陳維君 許安琪 黃世禎 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

SAS校園資料採礦競賽 Q&A IMTKU 淡江資管隊 指導老師:戴敏育 博士(Dr. Min-Yuh Day) 隊長: 杜駿(Chun Tu) 隊員: 陳維君(Wei-Chun Chen) 許安琪(An-Chi Hsu) 黃世禎(Shih-Chen Huang)