Download presentation
Presentation is loading. Please wait.
1
一种权衡风险收益的推荐方法 北京大学 作者:王卓 主讲人:邱镇
2
大纲 引言 相关工作 主要方法 应用研究 总结 -1-
3
引言 越来越多的需要在众多可选对象中进行抉择的问题 存在类似风险与收益的因素需要被权衡考虑 现有方法需要用户或相似用户的历史数据
需要一种不依赖用户方历史数据同时能够对风险及收益进行权衡来向用户进行推荐的推荐方法 主要说明存在这样的问题需要进行相关的研究 -3-
4
研究背景 关键问题 收益与风险的计算 风险相关性的引入 权衡 排序 -4- 不同场景有不同的具体细节需要考虑 统一的思路和策略
不同对象的风险之间存在相关性 权衡 排序 支配关系 对于互相之间没有支配关系的最大子集进行排序 关键问题 说明解决该问题需要相应解决的几个关键难点问题 风险相关性:例如:股票市场中,同种类型的股票具有一定程度上类似的风险,在很多情况下会同时涨跌。 支配关系:一方的收益和风险均优于另一方,在大多数情况下,可选对象的集合中最终都会出现一个支配全集中其他元素但元素之间相互没有支配关系的子集 -4-
5
大纲 引言 相关工作 主要方法 应用研究 总结 -5-
6
仅对根据用户需求对可选对象数据进行相应计算
相关工作 推荐系统 协同过滤的 推荐系统 用户及相似用户的历史数据 基于内容的 推荐系统 以用户历史数据为支撑 仅对根据用户需求对可选对象数据进行相应计算 相关工作的简单介绍 -6-
7
大纲 引言 相关工作 主要方法 应用研究 总结 -7-
8
主要内容 方法提出 针对前面提出的场景 基于现代投资组合理论提出TRPB推荐方法 在推荐场景中,将n个可选对象看做投资组合中的n只股票
通过现代投资组合理论提出相应的推荐方法 -8-
9
主要内容 -9- 推荐方法相关以及要解决问题的形式化描述
推荐方法相关以及要解决问题的形式化描述 与之前对于该理论的应用相比,不同在于强调对于风险的理解是收益的不确定新,因此以与收益相关的一个随机变量的期望作为收益,以其方差作为风险 -9-
10
方法框架 基本框架 -10-
11
大纲 引言 相关工作 主要方法 应用研究 总结 -11-
12
应用研究 打车位置推荐问题的基本形式化定义
13
方法应用 应用模型进行相应的风险与收益的计算 -13-
14
实验与分析 实验准备 数据集:北京市超过12000辆出租车2012年11月一个月时间内的所有GPS轨迹数据,共52.3GB
实验环境:Windows 8.1操作系统,CPU i7-3612QM,主频2.10GHz、2.10GHz,内存8GB。推荐方法使用C++在Visual Studio 2012编译器下实现并运行测试 -14-
15
权衡有效性测试 评价标准及参数 分别计算NDCGk(风险) 、NDCGk(收益) k取5、6、7、8 -15-
用于说明方法有效的在风险与收益之间进行权衡的实验 NDCG分数越接近于1说明对于相应条件下的排序越接近最优排序 TRPB方法的实验结果教接近于中间的角分线,说明对于风险及收益的权衡更好 -15-
16
风险与收益计算策略测试 测试结果 -16- 说明以收益相关的随机变量的期望作为收益方差作为风险的计算策略的优越性
对于计算策略的测试将TRPB方法与直观的以平均等待时间为收益,距打车地点的距离为风险的计算策略相比较,从结果中可以看出TRPB方法的等车时间波动较小,这是TRPB中使用等待时间分布函数的方差进行风险计算得到的结果,也说明了选择与收益相关的随机变量,以其期望和方差参与收益和风险的计算能够得到用户体验更好的推荐结果 -16-
17
GPS数据处理方法测试 基于路段 基于网格 依赖于路网数据 需要及时更新 网格中的所有道 路并不一定联通, 推荐的地点与能 等到车的地点不
相邻 两种GPS数据处理方法的比较
18
性能测试 测试结果 时间复杂度为O(k2)高于一般比较排序的复杂度 空间开销主要体现在数 据预处理的步骤,权衡 计算中,空间开销与k 成正比
时间开销的实验以及空间开销的说明 -17-
19
大纲 引言 相关工作 主要方法 应用研究 总结 -18-
20
总结 场景 分析 应用 成果 提出了可应用于上述场景的推荐方法 提出了更合理的风险与收益计算策略 在打车位置推荐场景中进行应用
使用推荐方法的具体过程 并在现实数据集上进行测试 分析已有相关工作,说明已有方法在本文提出的场景中应用时的不足之处 提出在缺乏用户历史数据的前提下,需要权衡风险与收益进行推荐的场景 场景 分析 成果 应用 转圈的顺序总结整篇文章 -19-
21
Thanks! 敬请各位老师批评指正!
Similar presentations