Data Mining 學期報告 信用卡瑕疵戶的判定 統博一 王信忠 統碩二 黃彥富 統碩一 洪慈翊 2019/4/6.

Slides:



Advertisements
Similar presentations
一、模型与计算公式 二、基本的组合分析公式 三、概率直接计算的例子 第 1.3 节 古典概率 四、抽签与顺序无关 五、二项分布与超几何分布 六、概率的基本性质.
Advertisements

1 债券融资业务拓展交流 债券业务部 二 O 一二年二月. 2 目 录  第一部分 债券融资业务概述  第二部分 东兴证券债券融资业务情况介绍及前景展望  第三部分 什么样的企业适合发债  第四部分 债券融资业务合作开发方式及激励探讨.
感情豐富的雙魚座 衝動的白羊座. 雙魚 處女 巨蟹 天秤天蠍 金牛 雙子 魔羯 水瓶 射手獅子 牡羊.
轴对称(一) 课堂引入 仔细观察下列图片,思考这些图片有什么样 的特点.
林園高中適性入學 高雄區免試入學 及 特色招生介紹 1. 國中學生 國中教育會考 1 ( 每年五月 ) 特色招生 術科考試 五專 免試入學 ( 每年六月 ) 特色招生 甄選入學 高中高職 免試入學 擇一報到 林園高中適性入學  入學管道流程 2.
易腐性商品三階段最佳補貨策略之研究 黃嘉彥 教授 勤益科技大學 研發科技與資訊管理研究所.
创意鄱阳湖— 一种基于无形资源理念开发鄱阳湖的思考 以传奇背景音乐作为开场,体现创意创造传奇 南昌大学 黄细嘉
牛熊證簡介.
肺癌放疗新概念: 瘤根靶向放疗 北京大学临床肿瘤学院 北京肿瘤医院放疗科.
防盜裝置  學生科技探究.
第四章:长期股权投资 长期股权投资效果 1、控制:50%以上 有权决定对方财务和经营.
饮食中的平衡 酸 性 食 物 与 碱 性 食 物.
期末書面報告指定書籍 王鼎鈞回憶錄---昨天的雲
第一章 会计信息系统 第一节 计算机会计概述.
川信-丰盛系列集合资金信托计划 2016年3月.
古文選讀.
农信社信贷产品实务技能提升培训.
台灣網路銀行網站之現況與比較 指導老師:吳有龍 A 曾馨慧.
自我介紹 姓名: 陳侑均 生日:84/9/6 興趣: 吹笛子 個性: 活潑 優點: 好學 星座:處女座 外號:猴子.
高齡者道路交通事故特性與道安防制措施 研究計畫報告
Some Knowledge of Machine Learning(1)
分類:基本概念、決策樹與模型評估.
是重要的感觉器官,有许多感觉器,具触觉、嗅觉功能,还能感受异性的性信息素。 触角由柄节、梗节和鞭节三部分组成。
第1章第3节 量化研究与质化研究 案例1:关于中学思想政治教师专业发展现状和需求的调查研究
项目亮点 融资方为AA级发债主体,是当地唯一的综合平台公司
我最喜歡的明星 邱鈺涵的報告.
复习 什么是结构? 结构是指事物的各个组成部分之间的有序搭配和排列。
巧用叠词,妙趣横生.
植物辨識及分類 呂春森 基隆市立暖暖高級中學 植物辨識及分類 呂春森 基隆市立暖暖高級中學.
如果光想著一件事情的難度而遲遲不肯行動 ,那麼將永遠不會成功 ,但只要你肯踏出第一步, 你就可能成功。
資料探勘(Data Mining)及其應用之介紹
第三课 闲话“家”常 1.
“华东师大数学系部分老同事活动”(辛卯聚会)记事
第五节 读图表述.
財團法人中華民國證券櫃檯買賣中心 交 易 部 中華民國101年8月
管理好种公鸡提高雏鸡质量.
走进 莱 芜 制作人:楠楠.
“这是一道选择题,请看题板:由于他( )成一个商人,日本鬼子没有认出他来。
第四章 时间序列的分析 本章教学目的:①了解从数量方面研究社会经济现象发展变化过程和发展趋势是统计分析的一种重要方法;②掌握时间数列编制的基本要求;③理解和掌握水平速度两方面指标的计算及运用④理解和掌握长期趋势分析和预测的方法。 本章教学重点:现象发展的水平指标和速度指标。 本章教学难点:现象变动的趋势分析。
腾冲叠水河瀑布 和来凤山公园 音乐:贝多芬——F大调浪漫曲 摄影、制作:曹珏 陈晓芬.
臺北市立松山家商 103學年度第1學期 學校日 教學說明 簡報
人无信不立 业无信不兴 公路建设市场信用体系 建设综述 交通运输部公路局 交通运输部公路局
資訊管理 第九章 資料採礦.
燦爛的星空.
金融数据挖掘和商业数据挖掘 建构信用卡评分模型之商业智能流程
Knowledge Engineering & Artificial Intelligence Lab (知識工程與人工智慧)
資料探勘-案例期末報告 SQL Server 2008 Analysis Service
法文 授課教師:歐德尼教授 第八單元 Les caractères et les signes. 個性與星座
ISABELLE 英四甲 Sid Christy Tiffany
如何寫工程計畫書 臺北市童軍會考驗委員會 高級考驗營 版.
Bounding Box Accuracy in Pedestrian Detection for Intelligent Transportation Systems David Fern´andez, Ignacio Parra, Miguel ´Angel Sotelo, Pedro A.
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
黃道十二宮 1.了解黃道十二星座的內涵 2.與老師互動共享活動的樂趣 3.動動腦作創意星座連線彩繪 4.幫自己的創意星座編個故事
近期科研汇报 报告人: 纪爱兵.
物联网数据处理 第一讲 数据处理基本概念 刘进军 QQ:
香港快樂指數 2007 何濼生教授 嶺南大學公共政策研究中心.
第1章 金融市場導論 授課老師: ______.
Course 4 分類與預測 Classification and Prediction
NO.004 職涯 報 徵才 實習 家教 國立嘉義大學 學生事務處學生職涯發展中心.
第十章 線上行銷研究.
主講人:陳鴻文 副教授 銘傳大學資訊傳播工程系所 日期:3/13/2010
第一章 金融市場簡介 金融市場 融資市場 借與貸的市場.
一、生命週期 二、經濟需求 三、收支狀況 四、人身風險事故 五、人生八大規劃 六、財務規劃
第十二章 顧客關係管理.
红利、年金、满期金自动转入聚宝盆,收益有保底,升值空间更大
九十學年度實務 專題報告 指導老師: 高玉芬 老師 學生: 張駿呈 張書嘉 林正浩
中国农业科学院博士后学术论坛 博士后基金申请的经验及体会 中国农业科学院生物技术研究所 秦 华 博士
古佳怡 AI 人工智慧.
Facebook 粉絲行銷學 成功經營出Facebook粉絲團的秘訣 天翼電訊股份有限公司 吳裕誠 總經理 決策公關集團
主 講 人: 任 立 中 博士 國立臺灣大學管理學院國際企業學系暨研究所副教授
Presentation transcript:

Data Mining 學期報告 信用卡瑕疵戶的判定 統博一 王信忠 統碩二 黃彥富 統碩一 洪慈翊 2019/4/6

動機及目的 信用卡資料庫 原理及方法 初步資料分析 分析結果 在實務上的決策 未來工作 簡  介

動機:  使否舊卡戶在信用卡終止 後皆發給新卡  考慮發新卡的對象 目的:判斷其是否為瑕疵戶 動機及目的

信用卡資料庫(一) [Q2]信用卡申請書的來源及方式, A1=1.Take-One郵寄 件 A2=2.現場辦卡, A3=3.電訪,A4=4.親訪,A5=5.親 訪, A6=6.親簽,A7=7.本行VIP、PB,A8=8.其他 [Q3]此信用卡是否在本行逾期超過30天, A1=1是, A2=2.否 [Q4]此信用卡持有人是否有呆帳記錄, (from JCIC) A1=1.是,A2=2.否 [Q5]此信用卡持有人是否有借款餘額>800萬元, A1=1.是, A2=2.否 [Q6]此信用卡持有人是否有退票記錄, [Q7]此信用卡持有人是否有拒往記錄, [Q8]此信用卡持有人是否有他行強制停卡記錄, [Q9]此信用卡持有人個人擁有的 信用卡 張數, A1=1.1 張, A2=2.2張 A3=3.3張,A4=4.4張, A5=5.大於4張 信用卡資料庫(一)

信用卡資料庫(二) [Q10]此信用卡持有人個人使用 信用卡 的頻率, A1=1. 天天用, A2=2.經常用,A3=3.偶而用,A4=4.很少 用,A5=5.沒有用 [Q11]此信用卡持有人未來一年個人有無申請 信用卡 的意願, A1=1.有, A2=2.沒有 [Q12] 此信用卡持有人戶籍所在地理區, A1=1.北部, A2=2.中部, A3=3.南部,A4=4.東部 [Q13]此信用卡持有人戶籍所在地都市化程度, A1=1.都 會, A2=2.都市, A3=3.城鎮 [Q14]此信用卡持有人之性別, A1=1.男, A2=2.女 [Q15]年齡, A1=1.此信用卡持有人之15-19歲, A2=2.20- 24歲, A3=3.25-29歲,A4=4.30-34歲, A5=5.35-39歲, A6=6.40-44歲, A7=7.45-49歲A8=8.50-54歲, A9=9.55-59歲 [Q16]此信用卡持有人之婚姻狀況, A1=1.未婚, A2=2. 已婚, A3=3.其他 信用卡資料庫(二)

信用卡資料庫(三) [Q17]此信用卡持有人之學歷, A1=1.小學及以下,A2=2. 國初中A3=3.高中職, A4=4.專科, A5=5.大學及以 上 [Q18]此信用卡持有人之職業, A1=1.國中及以下學生 A2=2.高中、高職學生, A3=3.夜間部高中、高職 學生 A4=4.專科學生, A5=5.夜間部專科學生, A6=6.大學生 A7=7.夜間部大學生, A8=8.管理職, A9=9.專門職 A10=10.技術職, A11=11.事務職, A12=12.銷售職 A13=13.勞務職, A14=14.服務職, A15=15.農林漁牧自營 A16=16.商工服務自營, A17=17.自由業自營 A18=18.經營者, A19=19. 家庭主婦 A20=20.家庭主婦(有兼副業), A21=21. 無職, A22=22.其他 [Q19]此信用卡持有人之個人平均月收入, A1=1.無收入, A2=2.10000元以下, A3=3.10001-20000元, A4=4.20001-30000元, A5=5.30001-40000元, A6=6.40001-50000元, A7=7.50001-60000元, A8=8.60001元以上 信用卡資料庫(三)

信用卡資料庫(四) [Q20]此信用卡持有人之個人平均月開銷, A1=1.10000 元以下, A2=2.10001-20000元, A3=3.20001-30000 元, A4=4.30001-40000元, A5=5.40001元以上 [Q21]此信用卡持有人之住家情況, A1=1.租賃, A2=2. 宿舍A3=3.父母所有, A4=4.本人所有, A5=5.配偶 所有, A6=6.其他 [Q22]此信用卡持有人之家庭平均月收入, A1=1.20000 元以下A2=2.20001-40000元, A3=3.40001-60000 元, A4=4.60001-80000元A5=5.80001-100000元, A6=6.100001元以上 [Q23]此信用卡持有人之平均月信用卡刷卡金額, A1=1.20000元以下, A2=2.20001-40000元, A3=3.40001-60000元, A4=4.60001-80000元, A5=5.80001-100000元, A6=6.100001-150000元, A7=7.150001-200000元, A8=8.200000元以上 [Q24]此信用卡持有人之宗教信仰, A1=1.佛教, A2=2. 道教,A3=3.基督教, A4=4.天主教, A5=5.一貫 道,A6=6.拜拜, A7=7.其他 信用卡資料庫(四)

信用卡資料庫(五) [Q25]此信用卡持有人之工同居住人口數, A1=1.一人, A2=2.二人,A3=3.三人, A4=4.四人, A5=5.人, A6=6.六人, A7=7.七人, A8=8.八人,A9=9.九人 [Q26]此信用卡持有人之家庭經濟客觀等級, A1=1.上, A2=2.中上A3=3.中, A4=4.中下, A5=5.下 [Q27]此信用卡持有人之血型, A1=1.A型, A2=2.B型 A3=3.AB型, A4=4.O型 [Q28]此信用卡持有人之星座, A1=1.牡羊座, A2=2. 金牛座, A3=3.雙子座, A4=4.巨蟹座,A5=5.獅子座, A6=6.處女座, A7=7.天秤座,A8=8.天蠍座 A9=9.射手座,A10=10.魔羯座, A11=11.水瓶座, A12=12.雙魚座 信用卡資料庫(五)

原理及方法 Decision Rule --Classification Method --Support Vector Machine

初步資料分析 原有資料 : 60000筆 遇到的困難 縮減後的資料 :7000筆 其中瑕疵戶僅為3287筆 Training Data :6000筆 ( 瑕疵和非瑕疵各3000筆 ) Testing Data :1000筆 初步資料分析

結 果 Support Vector Machine – Kernel : Linear -- TRAINING Summary of Classification --   Put into .... True Group.... Group 1 2 1 1575 1395 2 1425 1605 Total N 3000 3000 N Correct 1575 1605 Proportion 0.525 0.535   N = 6000 N Correct = 3180 Proportion Correct = 0.53 結  果

結 果 Support Vector Machine – Kernel : Linear -- TESTING Summary of Classification --   Put into .... True Group.... Group 1 2 1 139 362 2 148 351 Total N 287 713 N Correct 139 351 Proportion 0.484 0.492   N = 1000 N Correct = 490 Proportion Correct = 0.490 結  果

結 果 Support Vector Machine – Kernel : Polynomial -- TRAINING Summary of Classification --   Put into .... True Group.... Group 1 2 1 1815 1279 2 1185 1721 Total N 3000 3000 N Correct 1815 1721 Proportion 0.605 0.574   N = 6000 N Correct = 3536 Proportion Correct = 0.589 結  果

結 果 Support Vector Machine – Kernel : Polynomial -- TESTING Summary of Classification --   Put into .... True Group.... Group 1 2 1 134 323 2 153 390 Total N 287 713 N Correct 134 390 Proportion 0.467 0.546   N = 1000 N Correct = 524 Proportion Correct = 0.524 結  果

結 果 Support Vector Machine – Kernel : Radial -- TRAINING Summary of Classification --   Put into .... True Group.... Group 1 2 1 2540 382 2 460 2618 Total N 3000 3000 N Correct 2540 2618 Proportion 0.847 0.872   N = 6000 N Correct = 5158 Proportion Correct = 0.86 結  果

結 果 Support Vector Machine – Kernel : Radial -- TESTING Summary of Classification --   Put into .... True Group.... Group 1 2 1 135 355 2 152 358 Total N 287 713 N Correct 135 358 Proportion 0.470 0.502   N = 1000 N Correct = 493 Proportion Correct = 0.493 結  果

在實務上的決策 若判定為瑕疵戶, 我們可以有以下考量 舊約到期,不再給予換發新卡 推出新的信用卡,不以其為 行銷考慮對象 可作為該行資金往來的重要參考 在實務上的決策

未 來 工 作 對資料變數的選取 考慮非線性(Neural Network Analysis ) Association Rule 結合資料庫開發判別軟體 不同部別的關聯 (信用卡部及銀行部 ) 未 來 工 作

附錄一-聯合徵信中心 聯合徵信中心Joint Credit Information Center。 為國內財團法人組織,主旨在建置全國性信用資料庫、增進金融業徵信功能、促進徵信技能發展、提供經濟主體營運財務資訊、確保信用交易安全、提升全國信用制度健全發展。包括本國銀行、外商銀行在台分行、信託投資公司、票券金融公司、證券金融公司、信用合作社、農漁會信用部、保險公司等金融機構目前共有會員218家。 聯合徵信中心提供的資料,在各金融機構全力配合下,已相當完整,每一一借款人資料均加以建檔,因此只要曾經有過票據或債信等信用上的瑕疵,都會留下記錄。

附錄二 - 程式 matrix(scan("train.txt"), ncol=28, byrow=T)->credit.train matrix(scan("test.txt"), ncol=27, byrow=T)->credit.test   x<-credit.train[,2:28] y<-factor(credit.train[,1]) svm(x,y, kernel="linear")->model1 svm(x,y, kernel="polynomial",degree=2)->model2 svm(x,y, kernel="radial")->model3 predict(model1,credit.test)->pred1 predict(model2,credit.test)->pred2 predict(model3,credit.test)->pred3 predict(model1,x)->pred4 predict(model2,x)->pred5 predict(model3,x)->pred6 附錄二 - 程式