协同过滤推荐算法 及其模型的设计与开发 毕业论文答辩 陈鹏 - 信息与计算科学 指导老师:王国庆 – 2015-06-05.

Slides:



Advertisements
Similar presentations
许瑞云医师 你已经很努力地注意饮食、作息、运动, 为什么身体还不能恢复健康 ? 细节 答案就在「 细节 」裡, 唯有掌握关键的一步, 养生才能达到真 正的功效 ! 现在就让我们跟着曾是全球知名的哈 佛医院主治医师的许瑞云, 学习最正确 的养生方法, 轻松打下健康满分的基础 !
Advertisements

喜迎 G20 中国 CONTENTS 目 录目 录 1 中国美食 2 中国守护神 美食美食,顾名思义就是美味的食 物,贵的有山珍海味,便宜的 有街边小吃。但是不是所有人 对美食的标准都是一样的,其 实美食是不分贵贱的,只要是 自己喜欢的,就可以称之为美 食。吃前有期待、吃后有回味 的东西。美食遭遇心情的时候,
庄子思想 天地与我并生 万物与我为一 形而上的本体观念 法则、规范、不可思议之事. 庄子作品 极富想象力和浪漫色彩,擅用寓(寄托)言,《史 记》载: “ 其著书十余万言,大抵率寓言也 ” 。 又称《南华经》、《南华真经》 内篇 7 ,外篇 15 ,杂篇 11 《庄子》内容 《逍遥游》《齐物论》《养生主》《人间世》
一、老师申请题目,以下指导老 师操作。 1. 登录教务系统 web 端. 2. 点击 “ 毕业设计 ” 工具栏下拉菜单中的 “ 论文 _ 教师申请题目 ”
学分制改革为大学英语教学带来的 挑战与机遇 —— 武汉科技大学交流报告. Contents 武汉科技大学外国语学院简介 一 四 我校学分制改革后大学英语教学改革探索 二 学分制改革为大学英语教学带来的挑战 三 学分制改革为大学英语教学带来的机遇.
第6章 对象和类.
资源平台应用培训 武汉市交通学校信息化建设指导委员会.
因为爱,我们让研修果实更香甜 ——阜阳市临泉县小语1班第三期简报 编辑 葛泽付.
甘肃小吃 文产二班 陶方 羊肉泡 牛肉面 暖锅.
励行“三严三实” 争做新时期“好干部” 专题教育党课 国电内蒙古东胜热电有限公司张殿福 2015年6月.
104年度國立宜蘭大學新進主管研討 主計業務宣導說明
目 录 探索社会力量参与矛盾化解新模式 创新背景 主要做法 创新亮点 取得成效 杭州市信访局(“12345”)
102年實施之高中職及五專多元入學(含免試入學)之招生機制
C语言程序设计 李伟光.
读者与图书馆 2009年春季版 总第 15 期 山 东 交 通 学 院 图 书 馆 2009年3月.
教學經驗分享 吳毅成 國立交通大學資訊工程系 2012年4月.
人 工 智 慧 報 告 五子棋AI設計 報告者 : 潘輝銘.
周刊 总第38期 2013年6月1日 本期编辑:翁茜茜 温州滨海学校教科室主办
先秦诸子的性情人生 “语文教材微专题系列研究”之一 复旦附中 李郦.
校园信息管理系统 河北科技大学网络中心 2000/4/10.
SAE Java 实际应用 在这里写上你的标题 作者名字/日期
2012级暑期放假安全教育 及宿舍搬迁工作布置会 北京化工大学理学院 辅导员:曹鼎 2013年6月6日.
資料庫系統 曾俊雄.
第二章 项目一:企业厂区与车间平面设计 1.
生物化学与养生 化学三班 张震.
個人投資理財分析 財務狀況匯總表 銀行存款 共同基金 外幣基金 股票投資 保險價值 黃金投資 支出預算 房貸計算 不動產價值 資源變化資料庫
深入贯彻党的十七届四中全会精神 切实提高全区组织工作科学化水平
第八章 网络课程的设计与开发.
徵收苗栗市福全段147、1588及文心段10、11地號等4筆土地之
讲 义 大家好!根据局领导的指示,在局会计科和各业务科室的安排下,我给各位简要介绍支付中心的工作职能和集中支付的业务流程。这样使我们之间沟通更融洽,便于我们为预算单位提供更优质的服务。 下面我主要从三方面介绍集中支付业务,一是网上支付系统,二是集中支付业务流程及规定等,
关注教师、学生的应用体验 营造实用、高效的数字校园生态环境
中国人民公安大学经费管理办法(试行) 第一章总则 第四条:“一支笔” “一支笔”--仅指单位主要负责人。负责对本 单位的经费进行审核审批。
第一章 面向对象程序设计.
2015年云南财经大学图书馆 新生入馆教育考核试题 答题指南
转正述职报告 乐恩公司 史航
互联网时代班主任的挑战 万玮 2014年9月20日.
2016年6月.
解读《全国文化市场技术与服务平台应用规范》
项目办公室.
28 唯一的听众 九年制义务教育课本第十册 Contents 作者:落雪.
手术部位感染目标性监测存在的问题及对策探讨
软件设计模式与体系结构课程设计 周 宇 College of Information Science and Technology
鄉村尋根-農具篇.
Spring & mongodb java实战mongodb 曹巍 2013年9月22日.
天涯分布式数据库 云计算部.
C++语言程序设计 C++语言程序设计 第七章 类与对象 第十一组 C++语言程序设计.
第11章 系统结构与包模型模型.
SDA(Standard development architecture)框架介绍
基于struts和hibernate的网上新 闻发布系统
新个人所得税 相关政策解读.
汕头大学医学院附属肿瘤医院 医务科 药学部 2014年12月
Java程式初體驗大綱 大綱 在學程式之前及本書常用名詞解釋 Hello Java!程式 在Dos下編譯、執行程式
主编:钟元生 赵圣鲁.
微信商城系统操作说明 色卡会智能门店.
第四組 停車場搜尋系統 第四組 溫允中 陳欣暉 蕭積遠 李雅俐.
音乐1 工作坊 学习简报 (第1期) 音乐1坊主: 胡真真 2016年5月.
第二章 Java语法基础.
第三章 世界文明的蛻變與互動 第一節 歐洲社會的蛻變 第二節 世界文明的交匯 第三節 亞洲大帝國的發展 1.
“修身成材” 班级干部培训班 黑龙江大学党委学工部.
第二章 Java基本语法 讲师:复凡.
Scala编程
架构师成长感悟 吴隆烽
研发技术体系梳理 陈玮
第四組 停車場搜尋系統 第四組 溫允中 陳欣暉 蕭積遠 李雅俐.
方格紙上畫正方形.
大綱 一.受試者之禮券/禮品所得稅規範 二.範例介紹 三.自主管理 四.財務室提醒.
JAVA 程式設計與資料結構 第三章 物件的設計.
對於成員(member)存取權的限制 成員的資料被毫無限制的存取,任誰都可以指定任意值給成員,Java語言為了防止這種現象的產生,規定:有一種成員的資料不能任由類別外部的任何人隨意存取。
----以《西北民族音乐学术资源数据库》为例 西安音乐学院 景 月 亲
4.理財規劃者適格性分析與實作 理財規劃重點 生涯階段 「就業前準備階段」(學習階段) 「初入社會階段」 「確定職涯階段」 「維持職涯階段」
Presentation transcript:

协同过滤推荐算法 及其模型的设计与开发 毕业论文答辩 陈鹏 - 信息与计算科学 指导老师:王国庆 – 2015-06-05

目录 1 2 课题背景 协同推荐的原理 CONTENTS 3 余弦相似度设计 4 相关Web模块设计 5 6 测试数据及方法 总结

论文摘要 本论文通过对推荐系统的研究,进一步的说明推荐系统在信息过载时代的重要性以及处理信息模型的精巧之处。本论文主要研究多维空间向量相似度的在推荐系统的应用。根据这些算法,结合Java的一些特性,设计一个类库,更方便的使用该类算法进行过滤推荐。 协同过滤推荐,其原理是利用人们共同的喜好和行为为相似的人推荐他可能喜欢的信息,而用户的新的行为也会成为信息过滤的条件。 买了这本书的人也买了什么

设计该类库的背景 课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 现在是一个信息严重过载的时代,从消息流中找寻自己的爱好的信息也比较困难。协同过滤推荐过滤掉不喜欢的资讯,推荐用户喜欢的资讯,节省时间提高效率。 但是,直接用的话不是很方便,随时切换各种实现也不方便。 为了弥补这些缺陷,使人们更好的在面对海量数据时使用协同过滤算法,故设计了该组件,让人们更好的更方便的使用协同过滤推荐算法。

课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 收集用户资料 最近邻搜索(找到相似的用户) 计算推荐,产生推荐结果

MyCosSimilarity = cosθ * ModuloRate 课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 过程以及相关算法 其中, ModuloRate为 对两个向量进行取模、除运算,如果大于1取其倒数; cosθ为余弦相似度; MyCosSimilarity 的 取值范围为 [-1,1],越接近1越相似。 余弦相似度 取模余弦相似度(自行设计) 优点: MyCosSimilarity = cosθ * ModuloRate 兼顾角度和长度绝对值; 使用到的计算值均为之前的计算中间值,合理控制计算规模的增加。

Java类库设计 用到的特性 需要注意的问题 Java反射机制 注解与自定义注解 多态 多维空间向量之间的相似度的判断; 课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 Java类库设计 用到的特性 Java反射机制 注解与自定义注解 多态 需要注意的问题 多维空间向量之间的相似度的判断; 不同维度的权重衡量;

课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 类库主要类的继承关系

Java类库之用法 课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 @FilterType(CosSimilarity.class) public class EntityDemo { @FilterWeight(5) private int age; @FilterWeight private int sex;   private int id; // setter and getter... } @FilterType(MapCosineSimilarity.class) public class MapEntity { private int id; @MapFilter // 前者为向量名字,后者是向量的长度 private Map<Object, Double> map = new HashMap<Object, Double>(); // setter and getter...   }  这样就可以了

课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 业务逻辑表示 http://co.usee.tk

课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 首页

课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 与某用户相似的用户列表

课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 电影推荐列表

MovieLens 课题背景 协同推荐的原理 余弦相似度设计 相关Web模块设计 测试数据及方法 数据来自著名的MovieLens,本例子中采用了MovieLens的子集。MovieLens 是一个 推荐系统和虚拟社区网站,其主要功能是应用协同过滤推荐技术提供数据,数据形式是电影,利用用户对电影的喜好,向用户推荐电影。该网站是GroupLens Research实验室的一个项目,GroupLens Research实验室隶属于明尼苏达大学大学计算机系,MovieLens创建于1997年。MovieLens保存有用户对电影的评分,由此可进行个性化的协同过滤(推荐)。 MovieLens

总结 本文通过对协同过滤推荐算法、Java高级特性以及SpringMVC,Spring,MyBatis等相关知识技术的深入研究,实现了一个基于Java的协同过滤推荐类库,并且给出了基于SSI架构的Web项目Demo。方便大家使用、学习和研究。通过本文的深入研究,得出一下结论: 在设计类库时应充分考虑到使用的场景,大胆的设计,可以考虑使用高级特性,但使用高级特性不是目的,目的是方便更方便的使用该类库。 在开发的时候要充分考虑可扩展性,力求简单拓展,无论是类库还是其他。 采用SpringMVC可以十分轻松清晰的设计视图和具体逻辑的结构,方便前端和后端服务的对接,有利于后期系统拓展和维护。 采用MyBatis可以简单快捷的使用Native SQL,优化数据库性能时比较方便。 使用MVC模式,可以使项目结构清晰,有利于功能的解耦,简化开发流程,专注开发具体的模块功能。

总结 虽然开发出来的类库和该Web项目Demo有较多的优势,但是也存在一些问题。随着新的技术知识的不断涌现,要使程序能够高效运行,就要做进一步的研究和试验: 计算相似度涉及多维空间向量,需要的数据量比较大,尤其是在大数据时代,这就需要优化MySQL数据的存储结构,适当数据冗余,建立合适的索引,优化IO性能。还可以尝试使用NoSQL数据库,例如PostgreSQL、MongoDB等,提高性能。 计算相似度同样计算量也非常大,可以设计多线程分布式服务来解决这个问题,同时关注和研究新的高效的相似度计算算法,拓展在本类库中。  

文献综述 [1] Baron Schwartz,Peter Zaitsev,Vadim Tkachenko 著,宁海元,周振兴,彭立勋 等 译.高性能MySQL(第3版). 电子工业出版社, 2013.4. [2] 戴克(Paul Deck) [美] 著,林仪明 崔毅译. Spring MVC学习指南.人民邮电出版社.2015.5.6 [3] Cay S.Horstmann[美],Gary Cornell[美]. Core Java 2. Prentice Hall PTR ,2006.5. [4] 上野·宣[日]  著;于均良 译. 图解HTTP. 人民邮电出版社,2014.05.01. [5] 张为.基于Struts框架的JavaWeb应用研究[J].长沙电力学院学报,2006(2) . [6] Joshua Bloch(美) ,杨春花,俞黎敏译.Effective Java Second Edition[M].北京:机械工业出版社,2009.1 [7] 项亮. 推荐系统实践. 人民邮电出版社,2012.6

谢谢 协同过滤推荐算法 及其模型的设计与开发 陈鹏 - 信息与计算科学 指导老师:王国庆 – 2015-06-05