Presentation is loading. Please wait.

Presentation is loading. Please wait.

SAS校園資料採礦競賽 IMTKU 淡江資管隊 指導老師:戴敏育 博士(Dr. Min-Yuh Day) 隊長: 杜駿(Chun Tu)

Similar presentations


Presentation on theme: "SAS校園資料採礦競賽 IMTKU 淡江資管隊 指導老師:戴敏育 博士(Dr. Min-Yuh Day) 隊長: 杜駿(Chun Tu)"— Presentation transcript:

1 SAS校園資料採礦競賽 IMTKU 淡江資管隊 指導老師:戴敏育 博士(Dr. Min-Yuh Day) 隊長: 杜駿(Chun Tu)
隊員: 陳維君(Wei-Chun Chen) 許安琪(An-Chi Hsu) 黃世禎(Shih-Chen Huang)

2 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
大綱(Outline) 管理摘要(Executive Summary) 模型建置(Model Development) 研究結果(Experimental Results and Discussions) 結論(Conclusion) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

3 為何作這項研究? (Why this research?)
有效運用模型技術,找出回應率高的潛在顧客名單 以同樣的行銷成本,創造玉山產品電話行銷之最大利潤 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

4 研究中發現什麼?(What was found)
由玉山銀行所提供的10萬筆顧客名單作為訓練資料集,並結合SAS Enterprise Miner(EM)搭配SAS Enterprise Guide(EG)建置模型預測5萬名顧客名單,本團隊提供一萬名建議行銷顧客名單,並與主辦單位提供之五萬名正確回應顧客名單做比較,本團隊之模組預測回應率高達10.75% 20% % 50000名顧客 1835名顧客回應 10000名顧客 2011年全年顧客 10萬顧客名單\ 來預測2012年第一季50000名顧客 1075名顧客回應 58% 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

5 研究發現所代表的意義? (What those findings mean)
假設: 平均行銷一名顧客的電話成本為10元。 客戶回應即成為玉山顧客(回應後不一定成為玉山顧客,有可能因部分產品條件而不購買玉山產品或是玉山可能會因為信用條件而婉拒該顧客,本專案省略此部分) 本專案僅考慮行銷時的電話成本,其餘直接成本與間接成本暫不考慮。 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

6 研究發現所代表的意義? (What those findings mean)
平均成功一位顧客成本所需 10/3.67%=272元 每通電話行銷成本10元 50000名顧客 回應顧客1835人 總行銷成本為50萬元 平均成功一位顧客成本所需 10/10.75%=93元 玉山銀行行銷50,000名顧客,每名電話成本10元,總行銷成本為50萬元。 顧客回應人數為1,835人(=行銷名單50,000人*回應率3.67%),總產品收益為18,350萬元(=1,835人*10萬元)。 產品利潤=總產品收益1,835人*10萬元- 50萬元= 18,300萬元 仍行銷50,000名顧客,每名電話成本10元,總行銷成本仍為50萬元。 利用我們所建置之模型所挑出的顧客行銷名單,回應率將可高達10.75%,因此顧客回應人數將為5,375人(=行銷名單50,000人*回應率10.75%)。 產品利潤=總產品收益5,375人*10萬元- 50萬元= 53,700萬元 每通電話行銷成本10元 10000名顧客 回應顧客1075人 總行銷成本為10萬元 成本節省: (272-93)/272*100%=65% 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

7 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
研究發現所代表的意義? (What those findings mean) 透過電話產品行銷,結合我們所建置的模型之回應顧客建議銷售名單,可以替公司省下65%之行銷成本 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

8 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
所採取之行動?(What action) 針對模型所挑出的顧客行銷名單,配合電話行銷人力規劃及產品設計,分批進行行銷專案。 可設計行銷頻率,例如:每半年重複一次,在不影響顧客觀感下,可提高名單的利用價值。 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

9 模型建置(Model Development)
第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

10 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
模型建置-TIME WINDOW 圖一、模型建置之Time Window 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

11 模型建置(Model Development)
決策樹(Decision Tree) 迴歸(Regression) 類神經(Neural Network) 支持向量機(SVM) 模型比較(Model Comparison) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

12 模型建立(EM)-決策樹(Decision Tree)
Highlight 五個變數 我們設計的衍生變數在第三個 圖二、決策樹模型 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

13 模型建立(EM)-決策樹(Decision Tree)
所分枝的變數依序是 1.PRODUCT_4A(信貸正常) 2.ULC00302(全體金融機構預借現金金額) 3. ULC00303(全體金融機構上期未繳金額(循環)-截至2011年7月之未繳金額餘額) 4. CST_018(當月繳款金額) 其中前三個變數屬於衍生變數,作為決策樹分枝的依據可提升模型之預測能力 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

14 模型建立(EM)-迴歸(Regression)
圖三、迴歸參數調整 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

15 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
模型建立(EM)-迴歸(Regression) 圖四、迴歸模式輸出結果 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

16 模型建立(EM)-類神經網路(Neural Network)
圖五、類神經網路參數調整 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

17 模型建立(EM)-類神經網路(Neural Network)
圖六、類神經網路輸出結果 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

18 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
模型建立(EM)-支持向量機(SVM) 圖七、支持向量機(SVM)參數調整 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

19 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
模型建立(EM)-支持向量機(SVM) 圖八、支持向量機(SVM)輸出結果 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

20 模型建立(EM)-模型比較(Model Comparison)
ROC圖,可以比較模型好壞。看得出來是類神經比較好。 圖九、模型比較-輸出結果(ROC) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

21 模型建立(EM)-模型比較(Model Comparison)
觀察累積增益可以了解他的LIFT提升多少。 圖十、模型比較-輸出結果(LIFT) 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

22 研究結果(Experimental Results)
資料集與模型比較與結果 本研究依據不同變數反覆測試,整理出3筆資料集SAS_0731 (54個變數)、SAS_0801 (78個變數)以及SAS_0803 (108個變數),皆運用相同之模組與方法做行銷建議預測。各資料集之差異比較如下表: DATA SET SAS_0731 SAS_0801 SAS_0803 衍生變數+target欄位數 54 78 108 欄位相同處 顧客基本資料、預測目標變數 欄位相異處 行內行為資料 將月份整合為半年資料 將每個月份分開呈現(即是從原始資料中,由列轉為欄) 產品持有資料 無表示是否持有產品之24欄位 有表示是否持有產品之24欄位 用其中SAS_0801資料集為78個變數雖然較SAS_0803資料集108個變數少,使用SAS Enterprise Miner資料採礦技術建立預測模型卻為分析之最佳結果, SAS_0801資料表使用Neural Network (類神經)模型累積增益值為4.63,為最佳結果。 圖十一、三筆資料集差異比較表 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

23 研究結果(Experimental Results)
各資料表執行預測後之結果,其TRAIN累積增益數據比較如下表: MODEL\DATA SET SAS_0731 (54個變數) SAS_0801 (78個變數) SAS_0803 (108個變數) Regression (迴歸) 3.36 4.38 3.33 Decision Tree-1 (決策樹-手動自建樹) 4.09 4.41 Neural Network (類神經網路) 3.9 4.63 4.01 Decision Tree (決策樹-自動樹) 1 SVM 2.49 3.31 2.33 用其中SAS_0801資料集為78個變數雖然較SAS_0803資料集108個變數少,使用SAS Enterprise Miner資料採礦技術建立預測模型卻為分析之最佳結果, SAS_0801資料表使用Neural Network (類神經)模型累積增益值為4.63,為最佳結果。 圖十二、三種最佳模型比較表 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

24 研究結果(Experimental Results)
用其中SAS_0801資料集為78個變數雖然較SAS_0803資料集108個變數少,使用SAS Enterprise Miner資料採礦技術建立預測模型卻為分析之最佳結果, SAS_0801資料表使用Neural Network (類神經)模型累積增益值為4.63,為最佳結果。 圖十三、三種最佳模型比較-輸出結果(ROC) Neural Network_0801即SAS_0801資料集之Neural Network類神經模型ROC Curve為最理想之結果。由以上數據與圖表所示,因此本團隊最後決定使用SAS_0801資料集的Neural Network類神經模型為最後的決策模型。 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

25 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
結論(Conclusion) 經衍生變數評估與比較後,最終運用本小組整合衍伸後之SAS_0801資料集進行預測所提出10000筆建議銷售名單,其成交的預測機率範圍介於約0.70至0.05之間 使用SAS_0801資料集的類神經模型於預測出潛在顧客名單之回應率表現比較好 經反覆測試發現衍生變數愈多並不表示結果會愈符合預期 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

26 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
未來展望(Future Works) 未來運用本團隊之模型進行預測,若能取一萬名顧客以下之顧客即能達到理想結果,意即降低行銷成本,即能達到最佳效益,最終即可不必取一萬名而是取能達到最佳效益的顧客數量。 例如:若透過80/20法則,如果只需採用前20%人數作為建議行銷顧客名單(2000名回應顧客),希望可達到近50%以上之顧客回應率,即能大幅降低行銷成本 20% % 2000名顧客 50%↑ 10000名顧客 1075名顧客回應 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

27 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
前10名隊伍回應率之比較 10.75%  10.63% 10.60% 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

28 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊
致謝(Acknowledgment) 感謝SAS臺灣提供一個公正而又富挑戰性的舞台的機會,各校資料採礦高手一同組隊挑戰企業實例個案 感謝玉山銀行提供機會,將在經營實際所面對的問題以及相關數據資料,提供隊伍進行資料採礦分析,深入了解如何利用所學採礦理論與企業的實際案例做結合 感謝SAS的專業顧問及玉山銀行實際操作採礦分析的專家提供請益機會,達到理論與實務的實際結合學習作用。 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

29 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊成員
戴敏育 杜駿 陳維君 許安琪 黃世禎 第一屆SAS校園資料採礦競賽 IMTKU淡江資管隊 2012/9/21

30 SAS校園資料採礦競賽 Q&A IMTKU 淡江資管隊 指導老師:戴敏育 博士(Dr. Min-Yuh Day)
隊長: 杜駿(Chun Tu) 隊員: 陳維君(Wei-Chun Chen) 許安琪(An-Chi Hsu) 黃世禎(Shih-Chen Huang)


Download ppt "SAS校園資料採礦競賽 IMTKU 淡江資管隊 指導老師:戴敏育 博士(Dr. Min-Yuh Day) 隊長: 杜駿(Chun Tu)"

Similar presentations


Ads by Google