Download presentation
Presentation is loading. Please wait.
1
Data Mining 學期報告 信用卡瑕疵戶的判定 統博一 王信忠 統碩二 黃彥富 統碩一 洪慈翊 2019/4/6
2
動機及目的 信用卡資料庫 原理及方法 初步資料分析 分析結果 在實務上的決策 未來工作 簡 介
3
動機: 使否舊卡戶在信用卡終止 後皆發給新卡 考慮發新卡的對象 目的:判斷其是否為瑕疵戶 動機及目的
4
信用卡資料庫(一) [Q2]信用卡申請書的來源及方式, A1=1.Take-One郵寄
件 A2=2.現場辦卡, A3=3.電訪,A4=4.親訪,A5=5.親 訪, A6=6.親簽,A7=7.本行VIP、PB,A8=8.其他 [Q3]此信用卡是否在本行逾期超過30天, A1=1是, A2=2.否 [Q4]此信用卡持有人是否有呆帳記錄, (from JCIC) A1=1.是,A2=2.否 [Q5]此信用卡持有人是否有借款餘額>800萬元, A1=1.是, A2=2.否 [Q6]此信用卡持有人是否有退票記錄, [Q7]此信用卡持有人是否有拒往記錄, [Q8]此信用卡持有人是否有他行強制停卡記錄, [Q9]此信用卡持有人個人擁有的 信用卡 張數, A1=1.1 張, A2=2.2張 A3=3.3張,A4=4.4張, A5=5.大於4張 信用卡資料庫(一)
5
信用卡資料庫(二) [Q10]此信用卡持有人個人使用 信用卡 的頻率, A1=1.
天天用, A2=2.經常用,A3=3.偶而用,A4=4.很少 用,A5=5.沒有用 [Q11]此信用卡持有人未來一年個人有無申請 信用卡 的意願, A1=1.有, A2=2.沒有 [Q12] 此信用卡持有人戶籍所在地理區, A1=1.北部, A2=2.中部, A3=3.南部,A4=4.東部 [Q13]此信用卡持有人戶籍所在地都市化程度, A1=1.都 會, A2=2.都市, A3=3.城鎮 [Q14]此信用卡持有人之性別, A1=1.男, A2=2.女 [Q15]年齡, A1=1.此信用卡持有人之15-19歲, A2=2.20- 24歲, A3= 歲,A4= 歲, A5= 歲, A6= 歲, A7= 歲A8= 歲, A9= 歲 [Q16]此信用卡持有人之婚姻狀況, A1=1.未婚, A2=2. 已婚, A3=3.其他 信用卡資料庫(二)
6
信用卡資料庫(三) [Q17]此信用卡持有人之學歷, A1=1.小學及以下,A2=2.
國初中A3=3.高中職, A4=4.專科, A5=5.大學及以 上 [Q18]此信用卡持有人之職業, A1=1.國中及以下學生 A2=2.高中、高職學生, A3=3.夜間部高中、高職 學生 A4=4.專科學生, A5=5.夜間部專科學生, A6=6.大學生 A7=7.夜間部大學生, A8=8.管理職, A9=9.專門職 A10=10.技術職, A11=11.事務職, A12=12.銷售職 A13=13.勞務職, A14=14.服務職, A15=15.農林漁牧自營 A16=16.商工服務自營, A17=17.自由業自營 A18=18.經營者, A19=19. 家庭主婦 A20=20.家庭主婦(有兼副業), A21=21. 無職, A22=22.其他 [Q19]此信用卡持有人之個人平均月收入, A1=1.無收入, A2= 元以下, A3= 元, A4= 元, A5= 元, A6= 元, A7= 元, A8= 元以上 信用卡資料庫(三)
7
信用卡資料庫(四) [Q20]此信用卡持有人之個人平均月開銷, A1=1.10000
元以下, A2= 元, A3= 元, A4= 元, A5= 元以上 [Q21]此信用卡持有人之住家情況, A1=1.租賃, A2=2. 宿舍A3=3.父母所有, A4=4.本人所有, A5=5.配偶 所有, A6=6.其他 [Q22]此信用卡持有人之家庭平均月收入, A1= 元以下A2= 元, A3= 元, A4= 元A5= 元, A6= 元以上 [Q23]此信用卡持有人之平均月信用卡刷卡金額, A1= 元以下, A2= 元, A3= 元, A4= 元, A5= 元, A6= 元, A7= 元, A8= 元以上 [Q24]此信用卡持有人之宗教信仰, A1=1.佛教, A2=2. 道教,A3=3.基督教, A4=4.天主教, A5=5.一貫 道,A6=6.拜拜, A7=7.其他 信用卡資料庫(四)
8
信用卡資料庫(五) [Q25]此信用卡持有人之工同居住人口數, A1=1.一人,
A2=2.二人,A3=3.三人, A4=4.四人, A5=5.人, A6=6.六人, A7=7.七人, A8=8.八人,A9=9.九人 [Q26]此信用卡持有人之家庭經濟客觀等級, A1=1.上, A2=2.中上A3=3.中, A4=4.中下, A5=5.下 [Q27]此信用卡持有人之血型, A1=1.A型, A2=2.B型 A3=3.AB型, A4=4.O型 [Q28]此信用卡持有人之星座, A1=1.牡羊座, A2=2. 金牛座, A3=3.雙子座, A4=4.巨蟹座,A5=5.獅子座, A6=6.處女座, A7=7.天秤座,A8=8.天蠍座 A9=9.射手座,A10=10.魔羯座, A11=11.水瓶座, A12=12.雙魚座 信用卡資料庫(五)
9
原理及方法 Decision Rule --Classification Method --Support Vector Machine
10
初步資料分析 原有資料 : 60000筆 遇到的困難 縮減後的資料 :7000筆 其中瑕疵戶僅為3287筆
Training Data :6000筆 ( 瑕疵和非瑕疵各3000筆 ) Testing Data :1000筆 初步資料分析
11
結 果 Support Vector Machine – Kernel : Linear -- TRAINING
Summary of Classification Put into True Group.... Group Total N N Correct Proportion N = N Correct = Proportion Correct = 0.53 結 果
12
結 果 Support Vector Machine – Kernel : Linear -- TESTING
Summary of Classification Put into True Group.... Group Total N N Correct Proportion N = N Correct = 490 Proportion Correct = 0.490 結 果
13
結 果 Support Vector Machine – Kernel : Polynomial -- TRAINING
Summary of Classification Put into True Group.... Group Total N N Correct Proportion N = N Correct = Proportion Correct = 0.589 結 果
14
結 果 Support Vector Machine – Kernel : Polynomial -- TESTING
Summary of Classification Put into True Group.... Group Total N N Correct Proportion N = N Correct = 524 Proportion Correct = 0.524 結 果
15
結 果 Support Vector Machine – Kernel : Radial -- TRAINING
Summary of Classification Put into True Group.... Group Total N N Correct Proportion N = N Correct = Proportion Correct = 0.86 結 果
16
結 果 Support Vector Machine – Kernel : Radial -- TESTING
Summary of Classification Put into True Group.... Group Total N N Correct Proportion N = N Correct = 493 Proportion Correct = 0.493 結 果
17
在實務上的決策 若判定為瑕疵戶, 我們可以有以下考量 舊約到期,不再給予換發新卡 推出新的信用卡,不以其為 行銷考慮對象
可作為該行資金往來的重要參考 在實務上的決策
18
未 來 工 作 對資料變數的選取 考慮非線性(Neural Network Analysis ) Association Rule
結合資料庫開發判別軟體 不同部別的關聯 (信用卡部及銀行部 ) 未 來 工 作
19
附錄一-聯合徵信中心 聯合徵信中心Joint Credit Information Center。
為國內財團法人組織,主旨在建置全國性信用資料庫、增進金融業徵信功能、促進徵信技能發展、提供經濟主體營運財務資訊、確保信用交易安全、提升全國信用制度健全發展。包括本國銀行、外商銀行在台分行、信託投資公司、票券金融公司、證券金融公司、信用合作社、農漁會信用部、保險公司等金融機構目前共有會員218家。 聯合徵信中心提供的資料,在各金融機構全力配合下,已相當完整,每一一借款人資料均加以建檔,因此只要曾經有過票據或債信等信用上的瑕疵,都會留下記錄。
20
附錄二 - 程式 matrix(scan("train.txt"), ncol=28, byrow=T)->credit.train
matrix(scan("test.txt"), ncol=27, byrow=T)->credit.test x<-credit.train[,2:28] y<-factor(credit.train[,1]) svm(x,y, kernel="linear")->model1 svm(x,y, kernel="polynomial",degree=2)->model2 svm(x,y, kernel="radial")->model3 predict(model1,credit.test)->pred1 predict(model2,credit.test)->pred2 predict(model3,credit.test)->pred3 predict(model1,x)->pred4 predict(model2,x)->pred5 predict(model3,x)->pred6 附錄二 - 程式
Similar presentations