信用评分卡 第七组 团队 组长:范亚军 组员:张鹏伟、方俊雅、庞瑞、王漪慧 汇报人员:张鹏伟.

Slides:



Advertisements
Similar presentations
1/67 美和科技大學 美和科技大學 社會工作系 社會工作系. 2/67 社工系基礎學程規劃 ( 四技 ) 一上一下二上二下三上 校訂必修校訂必修 英文 I 中文閱讀與寫作 I 計算機概論 I 體育 服務與學習教育 I 英文 II 中文閱讀與寫作 II 計算機概論 II 體育 服務與學習教育 II.
Advertisements

公司為社團法人 股東之人數 林宜慧 陳冠蓉. 公司之意義  根據公司法第一條規定 : 「本法所 稱公司,謂以營利為目的,依照 本法組織、登記、成立之社團法 人。」
绿色开花植物是怎样繁衍后代的? 人类新个体的产生需要经历由雌雄 生殖细胞(即 : 精子和卵细胞)结合, 通过胚胎发育形成新个体的过程。这 个过程是靠生殖系统来完成。 人的生殖是生物界中普遍存在的一 种现象。
“ 菸 ” 之非福 Part Ⅰ. 你的想法 ─ Q1 :你覺得他很有個性嗎? Q2 :吸菸會增加個人魅力嗎? Q3 :吸菸會讓人感覺成熟?
刘小清 广东省心血管病研究所 先心流行病学研究. 流行学 美国 2006 年 -- 全球出生缺陷报告 全球每年新增出生缺陷 >800 万人 90% 发生在中低收入国家 每年大约有 330 万 5 岁以下儿童死于出生缺陷 320 万的儿童终生残疾 其中,先天性心脏病位居出生缺陷的首位.
第八章 劳动关系管理 第一节 劳动关系管理 第二节 劳动合同管理 第三节 劳动争议管理 第四节 劳动关系中的不平等与歧视问 题.
講師:汪 海 清 ( 前 ) 中央投資公司總經理 1.
西安交通大学 1. 2 概述 筛检和诊断试验的评价 提高筛检效率方法 西安交通大学 3 筛查起源于 19 世纪的结核病预防。一直 以来广泛运用于慢性病的早期诊断。从疾病 防治的过程来看,它属于一级和二级预防; 从对象和目的来看,它具有突出的公共卫生 意义;从实施来看,它要求检测方法快速、 简便、经济、安全。
學會摘要 四年級 ( 內容擷取自劍潭國小陳錦蓮和詹珮怡老師的簡報 ). 2 分享綱要 1 1 什麼是摘要 2 3 如何教摘要 實例與實際操作.
我們可以如何應付氾濫 ? 2c 第三組. 目錄 防洪 (1) 防洪 (2) 湖北坪興建三峽主壩簡介 長江三峽水利樞紐工程 三峽工程的利益 (Part1) 三峽工程的利益 (Part2) 三峽工程的弊 (Part1) 三峽工程的弊 (Part2) 總結 組員名單 完.
1 寫作測驗武功秘笈 洪德惠老師 99 年 1 月 18 日. 2 PART1 理論部分 3 寫作測驗的基本能力 1. 能掌握寫作步驟,充實作品內容,精確表達自 己的思想。 2. 能依收集材料立意、選材、安排段落及組織等 步驟行文。 3. 能運用觀察的方法觀察周遭事物,並能寫下重 點。 4. 能適切地遣詞造句,使用正確的標點符號,完.
聖若翰天主教小學 聖若翰天主教小學歡迎各位家長蒞臨 自行分配中一學位家長會 自行分配中一學位家長會.
文化教材 孟子選讀(一) 教學錦囊 一、儒家亞聖 二、滔滔雄辯 三、保有善端.
SCI 论文网 SCI论文写作 ——诊断试验类.
公職人員利益衝突迴避法規 及案例簡介 內政部政風處 科長陳定隆 102年10月.
備審資料與面試準備 高雄醫學大學醫學系 林郁涵.
公職人員財產申報法 與利益衝突迴避法概述 內政部政風處 科長陳定隆 102年9月.
專利申請實務 王淑靜
教學檔案的製作、評量與應用 連安青、游可如 國立東華大學附小教師.
专题 评析“毛泽东热”.
千秋大业在担当 《中国共产党问责条例》解读提纲.
第九章 認識勞退新制及因應之道 大葉大學 助理教授 邱祈豪.
F-5型戰機延壽計畫 執行期程:83-89 執行項目:
公職人員利益衝突迴避法規 及案例簡介 內政部政風處 科長陳定隆.
大型探索节目《谜》之 感恩.
新建本科院校 应用型人才培养若干问题探析 张德江.
憂鬱症:簡介、篩檢與治療 楊玉婉醫師 中國醫藥大學附設醫院神經部
物理系 成果報告 授課教師 : 梁贊全 輔導員 : 黃郁暉
2013年越秀区十大精品商务楼宇参评资料 中海物业东山广场项目
生命停看聽—生命圖書館 萬中選一的祝福 推薦人:彰師附工進修學校 蘇郁惠.
主題四-網路約會的合宜性 主題四-網路約會的合宜性 主題四-網路約會的合宜性 主題四-網路約會的合宜性 主題四-網路約會的合宜性
中國地名、組織機構名稱和英譯名的自動辨識
第七章 筛检 Screening.
回顾与展望:高州经验与广东医改 省卫生计生委、省医改办 黄 飞 2015年7月3日.
文化資源導論期末成果發表 — 塭內社區 • 組員: ˙指導教授:張瑋琦教授 ˙助教:葉于甄助教
IV501表 联网直报法人单位非金融资产投资情况表.
愛心月課程活動 設計者:洪雪玲老師.
《乡村教师支持计划 年》 解读.
目 录 CONTENTS 公积金信息系统升级概述 缴存和提取业务培训 第一部分 第二部分 Part 1 Part 2
元宵節 60704童翔威.
1-3 探究自然的科學方法.
中国出了个毛泽东.
《临床实验室管理学》课件 第十七章 诊断试验的临床效能评价.
務要火熱服事主.
固定资产加速折旧新政讲解 深圳国家税务局所得税处.
國立雲林科技大學 教師升等實務作業 報告人:人事室.
富力地产销售一部 ——各项目广告策划案 ——
姓名:梁晓莹 职务:安徽省旅游局安全办主任(高级经济师) 中国旅游研究院(华侨大学)旅游安全研究基地行业顾问 经历: 自1987年就职于安徽省旅游局 自2009年主持安全办工作 曾主编《旅游安全宣传手册——暨安徽旅游安全格言警句精选》、《安徽旅游安全》、《安徽旅游发展大事记》等 承办过“安徽省旅游安全演讲征文大赛”及“旅游安全调研成果奖”评选等工作.
作业现场违章分析.
蒙福夫妻相处之道 经文:弗5:21-33.
本活動 想解決的問題是……. 本活動 想解決的問題是…… 130最少要加上多少才能被8整除? 130最少要減去多少才能被8整除? 《除法定理》 被乘數=乘數 x 商 + 餘數.
主讲人:高亚兵 浙江外国语学院教育科学学院
雞蛋這樣孵出小雞的 動物的生殖 Part I.
快樂志工向前行 -晨光補救教學辛苦談- 臺北市中山區 懷生國小輔導室.
6.5滑坡 一、概述 1.什么是滑坡? 是斜坡的土体或岩体在重力作用下失去原有的稳定状态,沿着斜坡内某些滑动面(滑动带)作整体向下滑动的现象。
幼兒常見的健康問題(IV) 免疫系統方面的疾病.
家長教育 之 電子學習.
順德與香港為空氣污染 而制定政策 組長:曾惠敏 組員:溫琪華 葉子賢 許焯琛 溫煜彬 曾偉南 帶組老師:甘建基老師
聖本篤堂 主日三分鐘 天主教教理重温 (94) (此簡報由聖本篤堂培育組製作).
設計者:台中市 吳嵐婷 台北市興雅國中 林壽福
内容营销.
八、假設檢定 I (Hypothesis Testing Ⅱ)
管理心理学 职业经理人心理素养提升 讲师:孙阳.
公务卡日常管理篇 办卡激活/遗失补办/ 停用销卡/额度调整 财务处 2016年.
——向刑事案件被告人家属调查取证的伦理性讨论
大能的手—當患難來臨! 以賽亞 10.
馬前主席訪日行 中常會專題報告 報告人:蘇起 96年11月28日.
第四章 利率的結構與資訊內涵 授課老師:_____.
关于一些本体评价方法测评指标的综述 姜成樾.
Presentation transcript:

信用评分卡 第七组 团队 组长:范亚军 组员:张鹏伟、方俊雅、庞瑞、王漪慧 汇报人员:张鹏伟

项目背景 信用评分卡是近年来兴起的一种为保障银行和其他金融部门的金融安全而设立的一种关于金融权限的划定模型。 该模型指根据用户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。信用评分卡的建立是以对大量数据的统计分析结果为基础,具有较高的准确性和可靠性。

1 数据理解 2 数据预处理 项目流程 3 特征变量选择 4 模型建立与评估 制作信用评分卡 5

PART 01 数据理解 熟悉数据内容 更改字段名称 数据缺失情况 好坏客户比例

数据信息 缺失值情况 2019/12/4

理解数据 变量 基本属性 偿债能力 信用往来 财产状况 其他因素 包括了借款人当时的年龄 包括了借款人的月收入、 负债比率 两年内35-59天逾期次数、两年内60-89天逾期次数、两年内90天或高于90天逾期的次数。 信用往来 财产状况 包括了开放式信贷和贷款数量、 不动产贷款或额度数量 其他因素 包括了借款人的家属数量(不包括本人在内)

理解数据 好坏客户比例

PART 02 数据预处理 描述统计信息 处理异常值 处理缺失值

查看分析描述统计信息

处理异常值

处理缺失值

PART 03 特征变量选择 相关性检验 数据分箱 WOE值和IV值

变量的相关性检验 建模之前需要先检验变量之间的相关性,如果自变量之间具有强相关性,则会影响模型的准确性;如果自变量和因变量之间具有强相关性,则需要重点关注,后续提取特征时需要保留

数据分箱

计算WOE及IV值

计算WOE及IV值

PART 04 模型建立与评估 WOE值替换 数据切分 回归模型建立 模型评估

WOE值替换 转换可以将Logistic回归模型转变为标准评分卡格式。在建立模型之前,我们需要将筛选后的变量转换为WOE值,便于信用评分。 证据权重(Weight of Evidence,WOE) 转换可以将Logistic回归模型转变为标准评分卡格式。在建立模型之前,我们需要将筛选后的变量转换为WOE值,便于信用评分。

数据切分 线下门店 分成训练集和测试集 为了验证模型的拟合效果,我们需要对数据集进行切分,分成训练集和测试集。在对数据进行进一步的拆分之前,我们要考虑到对我们训练后的机器学习算法进行有效的检验。

数据切分 线下门店

 Logistic回归模型建立

模型评估 在精确率与召回率间进行权衡,调整分类器threshold取值,以FPR(假正率False-positive rate)为横坐标,TPR(True-positive rate)为纵坐标做ROC曲线;Area Under roc Curve(AUC):处于ROC curve下方的那部分面积的大小即AUC ROC 和AUC AUC=0.85

模型评估 KS指标: 用以评估模型对好、坏客户的判别区分能力,计算累计坏客户与累计好客户百分比的最大差距。KS值范围在0%-100%,判别标准如下: KS: <20% : 差 KS: 20%-40% : 一般 KS: 41%-50% : 好 KS: 51%-75% : 非常好 KS: >75% : 过高,需要谨慎的验证模型。 KS指标 KS=54%

PART 05 制作评分卡 训练集评分 制作评分卡

通过公式可以根据变量各特征属性的woe值及回归系数得到评分值 评分卡公式 通过公式可以根据变量各特征属性的woe值及回归系数得到评分值 本地 市场

训练集的综合评分 本地 市场

信用综合评分卡

有时候数学上的最佳答案并不是商业上最佳选择。 以《大数据时代的商业建模》中一句话作为结束 建模不能脱离商业环境和业务诉求。 有时候数学上的最佳答案并不是商业上最佳选择。

感谢在座各位的聆听 第七组 团队 组长:范亚军 组员:张鹏伟、方俊雅、庞瑞、王漪慧 汇报人员:张鹏伟