Presentation is loading. Please wait.

Presentation is loading. Please wait.

Personalize the Internet 线上、线下融合的大数据金融建模 张韶峰 百分点科技首席数据官

Similar presentations


Presentation on theme: "Personalize the Internet 线上、线下融合的大数据金融建模 张韶峰 百分点科技首席数据官"— Presentation transcript:

1 Personalize the Internet 线上、线下融合的大数据金融建模 张韶峰 百分点科技首席数据官 Shaofeng.zhang@baifendian.com

2 议程  传统的风险建模思路  线上线下融合的大数据风险建模思路  实践效果

3 经典的 FICO (费埃哲)评分卡变量 采用的变量: – 信用记录时间 – 信用额度 – 借款逾期记录 – 房屋按揭还款记录 – 用款占信用额度的比例 – 坏账记录 最最重要的变量:各种还款逾期、坏账数据 之前没有与金融机 构发生借贷关系的 用户无法被金融机 构有效地评估信用

4 目前的信用建模方法( FICO 流派) 金融机构的方法:使用金融数据进行金融 建模,大概 10-20 个强变量 Y (还款违约概率) = F ( X 1 , X 2 , … , X n ) Y <- (X 1, X 2, …, X n ) 金融类数据

5 中国征信体系的现状 人民银行征信中心有 3 亿多人的信用记录, 占中国总人口的 25% 仍有 75% 的人没有有效的信用记录,这将导 致大多数人的融资需求很难得到满足

6 议程  传统的风险建模思路  线上线下融合的大数据风险建模思路  实践效果

7 有否其他的信用建模方法? 百分点正在尝试的方法:使用非金融数据进 行金融建模,大概 500,000 个弱变量 Y (还款违约概率) = F ( X 1 , X 2 , … , X n ) (X 1, X 2, …, X n ) 消费、阅读、社交、 旅游、娱乐 … Y Y 金融

8 国外参考对象 ——ZestFinance 前 Google CIO 创立的大数据信贷模型公司 获得 1 亿美金投资 主要目标是帮助被 FICO 模型拒绝的人群重建信用以获得贷款 使用了包括以下数据来建模,包括 70000 多个变量 – 用户自己填写的 Demographic 信息 – 在放贷公司网站上面的行为 – 互联网数据,尤其是 SNS 数据 – 与第三方公司合作得来的数据

9 议程  传统的风险建模思路  线上线下融合的大数据风险建模思路  实践效果  数据来源  模型效果

10 公司背景与数据概述 百分点公司概况( www.baifendian.com ) www.baifendian.com 公司愿景:建立服务企业的大数据平台 浙报传媒等投资约 4 亿元 主要客户群(约 1500 家): 各大零售商与品牌商(包括线上线下),目前约 700 家 各大互联网媒体和社区,目前约 800 家 金融(银行、证券、保险和投资公司),目前约 70 家 积累了约 4-5 亿用户的消费、阅读、社交、资产 信息

11 跨商家、跨浏览器、跨设备、跨微信的实时数据挖掘 实体商品消费行为采集与挖掘 – 跨商家:麦包包、银座百货、王府井百货 – 跨浏览器与电子邮件,跨 PC 与移动设备:沱沱工社 – 跨浏览器与微信,跨 PC 与移动设备:快书包 资讯、社区与视频:财经、西祠胡同、水木清华社区财经西祠胡同水木清华社区 金融服务行为采集与挖掘 – 保险 保险 – 证券 –P2P 线下消费行为采集与挖掘 – 团购消费行为: 360 团购、金山团购 360 团购金山团购 – 商场内消费行为 高单价商品:奢侈品、房、车奢侈品房车

12 BFD 的合作伙伴 —— 内贸电商

13 BFD 的合作伙伴 —— 外贸电商

14 BFD 的合作伙伴 —— 媒体网站

15 传统零售

16 电信、航空、品牌行业的用户举例

17 议程  传统的风险建模思路  线上线下融合的大数据风险建模思路  实践效果  数据来源  模型效果

18 百分点大数据模型在风险防范上已经初显效果 经过 2 轮共 50 万真实用户的测试,基于百分点用户评估报告,可以 将该行信用卡不良率降低至之前的 1/2( 线下 ) 和 1/3( 线上 ) 某大型股份制商 业银行 A -信用卡 风险评估 经过 1 轮共 30 万真实用户的测试,基于百分点用户评估报告,可以 将该行信用卡不良率降低至原来的 1/1.6 某大型股份制商 业银行 B -信用卡 风险测试 经过 2 轮共 20 万真实用户的测试,基于百分点用户评估报告,可以 将该行信用卡不良率降低至原来的 1/1.4 将信用卡中心信用风险评估模型的 KS 值从之前的 0.28 (银行申请表 数据)提高到 0.45 (银行申请表数据+百分点用户评分报告) 某大型股份制商 业银行 C -信用卡 风险测试 基于百分点用户评估报告,已经将该公司不良率降低至原来的 1/3 。 某移动端小贷公 司-欺诈及信用 风险评估 线上数据整体匹配率 66.77% ,线下数据整体匹配率 43.50% 。可以将 不良率降低到以前的 1/2 某业内领先的 P2P 公司-信用风险 测试

19 银行申请表+百分点用户评估报告 KS:0.45 银行申请表数据 KS:0.28 信用风险评估模型 ( 某银行信真实模型 ) 只使用申请表数据 0.28 模型可用 >0.32 银行现状 申请表+央行报告 0.38 左右 申请表+百分点报告 0.45 KS 值 * 注: KS 值被用来评判模型区分好坏客户的能力,是银行界统一使用的标准。 KS 值越大模型越好

20 金融客户(含测试)

21 申请评分卡-模型效果

22 申请评分卡-评分卡示例 入选变量变量取值分值 发生交易次数最多 的项目类别 娱乐、未知 3C 数码 餐饮食品、出差旅行 穿衣打扮、居家生活 36 46 64 51 发生访问次数最多 的项目类别 娱乐、未知 时政新闻、文学 / 艺术、财经、生活 / 地方类社区、历史 / 社会 / 人文 汽车、管理、旅游 / 交通、健康 / 医药、数码 /IT 、母婴育儿、时尚 / 女人、 科学 / 教育、音乐 / 视频 知识 / 问答、游戏 / 动漫 33 48 56 40 匹配类型 只有 ID 或者邮箱匹配 ID 和邮箱匹配 or 只有手机匹配 ID 和手机匹配 手机和邮箱匹配 or ID 、手机和邮箱都匹配 35 39 45 49 用户在娱乐类目的 消费级别 <0.48 or 未知 >=0.48 and <0.68 >=0.68 and <0.96 >=0.96 69 56 52 50 用户 3C 数据类目的 消费金额 <550 or 未知 >=550 and <4400 >=4400 39 51 54

23 小额贷款 ( 含 P2P)

24 整体数据匹配情况 原始数据匹配数据匹配率匹配违约匹配非违约匹配违约率未匹配违约未匹配非违约未匹配违约率 总数据量 xxxxx 55.12%xxxxx 6.86%xxxxx 11.96% 证件号数量 xxxxx 46.99%xxxxx 手机数量 xxxxx 41.54%xxxxx 邮件数量 xxxxx 34.09%xxxxx 线上原始数据匹配数据匹配率匹配违约匹配非违约匹配违约率未匹配违约未匹配非违约未匹配违约率 总数据量 xxxxx 66.77%xxxxx 7.57%xxxxx 12.93% 证件号数量 xxxxx 57.36%xxxxx 手机数量 xxxxx 47.80%xxxxx 邮件数量 xxxxx 34.09%xxxxx 1xxxxx 线下原始数据匹配数据匹配率匹配违约匹配非违约匹配违约率未匹配违约未匹配非违约未匹配违约率 总数据量 xxxxx 43.50%xxxxx 5.32%xxxxx 9.58% 证件号数量 xxxxx 35.50%xxxxx 手机数量 xxxxx 35.30%xxxxx 邮件数量 xxxxx 0.00%xxxxx 线上数据整体匹配率 66.77% ,线下数据整体匹配率 43.50% ,线上匹配情况优于线下匹配情况; 匹配客户违约率显著低于未匹配客户。

25 线上产品数据匹配情况 工薪类型贷款 原始数据匹配数据匹配率匹配违约匹配非违约匹配违约率未匹配违约未匹配非违约未匹配违约率 总数据量 xxxxx 60.48%xxxxx 5.56%xxxxx 13.45% 证件号数量 xxxxx 51.25%xxxxx 手机数量 xxxxx 42.28%xxxxx 邮件数量 xxxxx 27.46%xxxxx 生意类型贷款原始数据匹配数据匹配率匹配违约匹配非违约匹配违约率未匹配违约未匹配非违约未匹配违约率 总数据量 xxxxx 71.69%xxxxx 6.53%xxxxx 11.68% 证件号数量 xxxxx 60.33%xxxxx 手机数量 xxxxx 50.21%xxxxx 邮件数量 xxxxx 38.72%xxxxx 工薪类型贷款和生意类型贷款的匹配客户违约率显著低于未匹配客户。

26 POS 贷款

27 使用效果 通过 “POS 流水数据 + 商户户主个人数据 + 商户关键刷卡人个人数据 ” 三类数据联合建模 来预估商户的套现风险以及 POS 贷款违约风险,均发现百融数据具有较强的指示作用,主 要体现着信息的真实性和商户信用特征上,主要体现在以下几点: 如果商户身份证和电话在百融数据中显示是一致的的,则风险较低; 如果商户的个人信用和企业信用分值较高,则风险较低; 如果用商户匹配的 profile 中有多个身份证号码,则风险较高; 如果百融显示商户在游戏、动漫、娱乐等类目上消费级别高,则风险很高; 如果百融显示商户在经管、科技等类目上活跃度较高,则风险较低; 如果百融数据显示商户关键刷卡人有多个身份证、手机号等,则风险较高; 如果百融数据显示商户关键刷卡人与商户有共同的地址信息,则风险较高; 核心诉求 1—— 在商户引入阶段进行小微企业主评估,以降低恶意套现。 核心诉求 2—— 在 POS 贷审批阶段进行小微企业主评估,以降低违约风险。

28 移动端小额贷款

29 1 、欺诈风险评估 某小贷公司基于手机 APP ,主要面向 3 线及以下城市的用户进行授信操作。 基于百融用户评估报告,该小贷公司对用户进行欺诈风险评估以及信用风险评估, 将不良率降低至原来的 1/3 。 针对以下客户申请信息,该小贷公司通过百融进行信 息核查,以识别欺诈用户,降低准入风险。 2 、信用风险评估 申请评分: 百融为该小贷公司提供 “ 百融个人申请评分 ” , 作为客户准入的审核指标。 专家规则: 通过联合建模分析,百融基于 “ 用户评估报告 ” 为该小贷公司生成针对性的专家规则,作为该小贷 公司主要的审核指标。目前,该小贷公司针对贷款 申请用户,如果发现其在百融评估报告中,显示在 “ 游戏 ” 、 “ 动漫 ” 、 “ 娱乐 ” 等 4 个类目上消费力排名 80% 以上,则直接进行拒绝授信操作。 某小贷公司小额信用贷款授信

30 Personalize the Internet


Download ppt "Personalize the Internet 线上、线下融合的大数据金融建模 张韶峰 百分点科技首席数据官"

Similar presentations


Ads by Google