基于多用户反馈的实体类型选择方法与实现 丁基伟 指导老师:瞿裕忠 2014-11-24
课题背景 随着Linked data中实体信息的质量与数量逐步提升, 越来越多的搜索、浏览需求都围绕实体展开。[1] 类型信息是实体的重要属性,它能够清楚地描述实 体的基本含义,并能方便地从知识库中获取。 许多实体搜索、浏览系统都会使用实体的类型信息, 帮助用户区分不同实体,或者帮助用户理解实体的 基本含义。 然而,一个实体并不只有一个类型属性,而是和许 多“或具体或抽象”的类型相关联。通常来说,一 个实体有超过10个属性。 因此如何为每个实体挑选重要的几个类型,是值得 研究的问题。
相关工作 到目前为止,计算机工作者已经对实体类型选择 问题进行了充分的研究。 目前主要的实体类型选择方法有:[2] 根据实体自身信息选择 根据上下文内容选择 根据类型层次结构选择 使用机器学习方法综合选择 此外,分面式搜索中判断一个分面(类型)和一 个实体相关程度的方法[3][4],也可以用在实体 类型选择中。 然而,这些方法都没有人的参与。从用户评价及 实验指标两方面看,这些方法都存在提升的空间。
课题目标 查阅当前主流实体类型选择方法,实现实体选择 算法并比较。 设计基于多用户反馈的类型选择优化算法,提升 主流实体类型选择算法的效果。 设计实验比较上述两类方法,判断是否有显著提 升。 设计合理的用户交互方式,使用户能够方便地进 行类型信息的浏览,以及反馈的提交工作。 将该实体类型选择方法实现到Sview系统中。
交互方式 排序 选择 Fellows of the leopoldina Jewish american scientists Naturalized citizens of the united states American people of swiss- jewish descent Nobel laureates in physics Yago legal actor geo PersonWithOccupation Theoretical physicists German philosophers 选择 Fellows of the leopoldina Jewish american scientists Naturalized citizens of the united states American people of swiss- jewish descent Nobel laureates in physics Yago legal actor geo PersonWithOccupation Theoretical physicists German philosophers
交互方式 着色 云图 Fellows of the leopoldina Jewish american scientists Naturalized citizens of the united states American people of swiss- jewish descent Nobel laureates in physics Yago legal actor geo PersonWithOccupation Theoretical physicists German philosophers 云图
进度安排 2014年11月-2014年12月,阅读实体类型选择方面 文献,编写代码实现其中的算法。 2014年12月-2015年2月,设计基于多用户反馈的 类型选择优化算法,并予以实现和简单测试。 2015年3月-2015年4月,设计人机交互方式,设计 实验测试上述两类方法,开始毕业论文的写作, 完成中期报告。 2015年5月-2015年6月,完善实体类型选择系统, 并将该系统部署到实体浏览系统SView中。完成毕 业论文,并争取投稿研究论文一篇。
谢 谢 参考文献 [1] Nie, Z.; Ma, Y.; Shi, S.; Wen, J.; and Ma, W. 2007. Web object retrieval. In Proceedings of 16th International World Wide Web Conference, 81–90. ACM Press. [2] Tonon, A.; Catasta, M.; Demartini, G.; Cudre-Mauroux, P.;and Aberer, K. 2013. TRank: Ranking entity types using the web of data. In Proceedings of 12th International Semantic Web Conference, 640–656. Springer. [3] Vandic, D.; Frasincar, F.; and Kaymak, U. 2013. Facet selection algorithms for web product search. In CIKM’13, San Francisco, CA, USA, 2013, 2327–2332. [4] Liberman, S., and Lempel, R. 2012. Approximately optimal facet selection. In Proceedings of the ACM Symposium on Applied Computing, SAC 2012, Riva, Trento, Italy, March 26-30, 2012, 702–708.