Download presentation
Presentation is loading. Please wait.
1
基于大数据挖掘的电话销售策略 --- 以百姓网电话销售业务为例
孙甜 各位专家上午好。我是同济大学的梁哲,非常荣幸能向各位专家汇报我的研究工作。 百姓网 营收部
2
提纲 介绍 建模 未来研究课题
3
百姓网介绍 分类信息平台
4
国内外分类网站介绍 国家 网站名 国内排名 职员 年收入*(百万美金) 成立年份 美国 Craigslist 1 50 160 1995
俄国 Avito.ru 270 75 2007 法国 leboncoin.fr 230 200 2006 中国 58同城 6200 115 2005 赶集 2 4000 80 2004 百姓 3 146 10~20 *估计值
5
中国分类网站
6
百度指数 年收入(估) 公司规模(人数) 人年均贡献 中国三家分类网站对比 百姓网: 数据驱动 精英小团队 百姓网 58同城 赶集网
6亿 5亿 1亿 百姓网: 数据驱动 精英小团队 5千人 100万 百度指数 收入 人数 百姓网 126 数千万美金 100人 58同城 364 1~2亿美金 5000 赶集网 385 1~2亿美金 3000 3千人 17万 12万 100人
7
百姓网和58同城的电销运营模式对比 58同城/赶集网 百姓网 销售人员总数 缺乏系统管理以及数据挖掘技术 销售人员总数
4500 缺乏系统管理以及数据挖掘技术 拨打决定由销售人员决定 意向度低的客户被多次拨打 效率低 销售人员总数 40 利用数据挖掘技术促进销售业务 利用商业智能系统做出更好决定 评估客户意向度 效率高
8
目标客户群 百姓网电话销售运营模式介绍 有商业推广需求的中小企业、商家 已在分类网站上发布过信息
对网站付费产品的购买不熟悉,需要销售人员帮助
9
百姓网电话销售运营模式介绍 商业目标: 销售网站的付费产品
10
静态数据 动态数据 电销营销数据 客户数据 城市、行业、注册时间、公司、联系方式等 发帖行为:发帖数,发帖渠道(电脑、手机、其他)
账户情况:账户余额,现金流 购买记录 电销营销数据 拨打电话数、通话时长、通话时间、对应销售 结果数据:是否成单、成单金额
11
商业理解 电话销售过程 先充值后消费:客户如希望购买某类产品,需要先向百姓网账户中充入一定金额,然后用账户中的金额进行购买
在线操作:客户的充值消费行为均可在线独立进行,销售人员不可以进行上门收款、代充值等行为 填写销售编号:如果客户认可销售人员的服务,在充值时在销售编号区域填写相应的销售人员的编号 避免骚扰客户:销售人员只能拨打被分配的电话。电话号码由百姓网总部统一分发,分发频率为每天1次
12
提纲 介绍 建模 未来研究课题
13
数据描述 目标 挖掘潜在客户的成功率预测模型 14万条电话记录 4.5万个注册客户 40个坐席
时间跨度:3个月。2014年7月-2014年10月 177个变量 目标 找到能够有效帮助电销业务的数据挖掘模型 预测每位客户的成单可能性 提高电话销售效率
14
数据示例 号码 通话时长 充值总金额 充值次数 消费总金额 得到券总金额 得到券总数 用掉券总数 充值失败次数 账户余额 所属市场营收 ….
40 1000 2 400 20 1 3 100000 ….. 500 10 2000 …… 340 3000 5 789 30 60000 5600 6 600 …….
15
程序包:rminer、caTools、ROCR、lars、rpart、randomForest等
挖掘潜在客户的成功率预测模型 0-1 分类模型 线性回归 逻辑回归 LARS&LASSO回归 决策树 随机森林 神经网络 SVM 编程语言:R 程序包:rminer、caTools、ROCR、lars、rpart、randomForest等
16
模型结果 模型 AUC 线性回归Full Model 0.850 线性回归Forward Selection 0.807
线性回归Backward Selection 0.803 线性回归Stepwise Selection 0.806 逻辑回归 0.810 LARS 0.800 LASSO 决策树1 0.757 决策树2 0.862 决策树3 SVM 0.847 神经网络1 0.876 神经网络2 0.875 神经网络3 0.883 随机森林Full Model 0.921 随机森林去掉稀缺变量 0.922 随机森林用stepwise变量 0.930 randomForest 哪些decision tree 是显著的?
17
结果分析 关键数据值
18
Cumulative Lift Chart 模型结果 随机森林给出最好结果 随机森林 线性回归 付费客户覆盖率% 逻辑回归 决策树
接触客户比例% 付费客户覆盖率%
19
Cumulative Lift Chart的优点
模型应用 排名前20%的客户,被成功转化的占比为76% Cumulative Lift Chart的优点 直观易懂 帮助管理者做出盈利决定 Break-Even Point 从电销团队运营成本、人员工资等折算出:平均一个电话的成本为7元人民币 从成单金额折算出:平均一个成单电话带来的利润为:400元人民币 因此,当转化率为1.7%时,达到break-even point 76% 20%
20
Confusion Matrix 模型结果 转化率由3%提升至9.5%,提高316% 工作量降低70% 电销业界平均转化率:3.5%~5%
实际 预测 未成单 成单 17857 6384 83 676
21
将模型嵌入号码分配器,每日生成待选号码 将待选号码按照预测成功率倒序排列 按照实际需要量随机分配 利用报表监控,观测实际值 如何投入应用?
日期 分配器添加数 拨打率 拨打转化率 总转化率 出库数 预测平均成功率 2210 0.679 0.039 0.026 1400 0.015 1910 0.497 0.018 0.009 1085 0.020 1624 0.539 0.03 0.016 883 0.013 2558 0.019 0.837 794 0.011
22
传统行业 互联网影响 探索站外信息对模型的改进 主要专注于公司内部的信息 银行、保险业、传统医疗业、制造业 大量信息对公众开放
航空业:价格公开、售卖量公开 电商:价格、商品评论、售出量、库存量 分类网站:帖子内容、联系方式、点击量、访问客户数
23
动机 从其他同类型网站获取客户信息 探索站外信息对模型的改进 客户在其他同类型网站的行为可以帮助我们更好了解客户在百姓网的行为以及需求。
记录该客户在其他网站的发帖信息 收集每个客户的行为数据,并评估 定义CPI(customers purchase index):客户消费指数 将消费指数作为新变量投入模型
24
Customer Purchase Index (CPI)
客户消费指数 例子 记录客户在一个市场的帖子的位置信息 Customer Purchase Index (CPI) 𝐶𝑃𝐼= 𝑎𝑙𝑙 𝑝𝑜𝑠𝑡 1 𝑝𝑜𝑠𝑖𝑡𝑖𝑜𝑛 Mobile Ad_id Position Date 4 10 100 500
25
改进后的模型 数据描述 目标 12万条电话记录 4.5万个注册客户 40个坐席 时间跨度:3个月。2014年7月-2014年10月
177个变量 将客户消费指数作为变量 目标 找到能够有效帮助电销业务的数据挖掘模型 预测每位客户的成单可能性 开拓新客户 调查站外数据的价值
26
模型结果 Cumulative Lift 随机森林模型给出了最好结果 随机森林 线性回归 逻辑回归 决策树 接触客户比例% 付费客户覆盖率%
27
Confusion Matrix 模型结果 新客户转化率由2%提升至7.6%,提高380% 工作量降低75%
电销业界平均转化率:3.5%~5% 实际 预测 未成单 成单 19647 4856 97 400
28
通过信息获取驱动付费用户数增长 商业模式带来的模型启发 付费用户有天然的多渠道推广需求 渠道多客户多利润高
百姓网为用户提供多种信息迁移工具 搬家大师、开放API、信息联盟等 免费增值商业模式(Freemium Business Model) Step1:为用户免费迁移信息至百姓网 Step2:如果想获得更多推广效果,可选择增值服务 (购买百姓网付费产品)
29
第二步:输入在其他网站发布信息留的联系方式
搬家大师功能介绍 第一步:点击百姓网搬家大师按钮 第二步:输入在其他网站发布信息留的联系方式 第三步:选择搬运到百姓网的信息
30
第一步:在线引导用户将信息迁移至百姓网 第二步:销售团队介入,引导用户付费 针对多渠道发帖的付费用户的营销策略 信息 用户身份
58同城&赶集网 百姓网 免费用户 付费用户 销售团队介入
31
商业部署 为电销团队扩建提供合理建议
32
提纲 介绍 建模 未来研究课题
33
尝试新理论、新模型 研究新的业务问题 未来研究课题 Sparse Optimization
Subspace clustering/Robust subspace clustering 研究新的业务问题 老客户维护周期研究、最佳接触时间点研究 新客户行为研究 客户和销售人员匹配问题研究
34
其他项目&系统简介 定价系统 电销可视化管理系统 数据库系统、数据挖掘系统 营收管理系统 客户管理系统
35
非常感谢! 汇报人: 孙甜 百姓网 以上就是我的汇报,谢谢大家。 请各位专家批评指正!
Similar presentations