Download presentation
Presentation is loading. Please wait.
1
实体浏览中属性呈现方法研究 徐江 2016届毕业生毕业设计 设计方案
2
目录 第1章 绪论 第2章 预备知识 第3章 实体属性的分类呈现 第4章 基于聚类算法的实体属性呈现
1.1 课题背景 相关工作 主要研究内容 论文结构 第2章 预备知识 2.1 语义网相关概念 语义网浏览技术介绍 第3章 实体属性的分类呈现 3.1 问题描述 方法概览 构建实体属性附着类型 挖掘频繁的属性组合 3.5 基于BMC模型分配属性 3.6 属性分类结果分析 第4章 基于聚类算法的实体属性呈现 4.1 属性关联度的度量标准 4.2 基于聚类算法的实体属性划分 4.3 实体属性划分结果分析 第5章 语义网浏览器SView的设计与实现 第6章 实验评估 5.1 实验方法概述 属性的分类呈现评测 系统有效性评测 第7章 结束语
3
研究背景 语义网正在飞速发展:数据增长,应用场景更多,更为大家熟知。 实体的浏览对于用户使用语义网满足信息、知识需求很重要。
相较于传统万维网的HTML和XML文档,语义网数据缺乏文档结构,不利于人们阅读和理解 对于一个实体,当实体属性的数目很大时,用户浏览需要有效的层次结构进行浏览
4
通用的语义网浏览器 Marbles Disco
5
实体属性的分类呈现 研究背景 对于一个实体及描述该实体的RDF句子,将RDF句子按照所描述的属性进行组织。当实体 描述包含几十或上百的属性时,我们需要对属性进行分组和排序,便于用户浏览 对于一个实体,该实体的描述通常包含多个主题。因此我们可以基于主题对实体属性进行 分类,并对选择的类型进行排序 实体属性的分类可以用于实体浏览以及实体摘要
6
实体属性的分类呈现 属性的附着类型、实体的声明类型 的统计分析 统计分析LOD和本体中: 1、实体的类型声明情况; 2、属性的domain和range声明情况。 对于没有声明domain和range的属性,对属性可能的附着类型进行挖掘
7
实体属性的分类呈现
8
实体属性的分类呈现 挖掘频繁属性组合 频繁属性组合需满足一下要求: - 属性的range可以兼容 - 对属性及其取值进行统计分析
2. 基于属性关联度对属性进行聚类
9
实体属性的分类呈现 概要分析:Goodness of a type Specificness: 类层次结构中type到叶节点的最小距离
Group Size: 可以分配到type的属性的数目
10
实体属性的分类呈现 基于BMC模型选择合适的类型 选出top-k个类型,并将有关属性分配到合适的类型中,最终形成一个类型-属性的二层结构
11
基于聚类算法的实体属性呈现 属性关联度度量: 属性标签字符串相似度: 使用I-Sub计算两个字符串相似度
属性标签:通过rdfs:label, foaf:name, dc:title 或是 local name可以获得易读的属性标签 属性标签字符串相似度: 使用I-Sub计算两个字符串相似度 属性标签语义关联度: 基于wordnet计算两个属性标签的语义关联度
12
基于聚类算法的实体属性呈现 属性关联度度量: 属性取值相似度: 使用向量空间模型计算两个属性取值相似度 属性取值类型的关联度
属性分布的关联度: 在数据集中对属性的共现进行统计分析
13
基于聚类算法的实体属性呈现 对 属性关联度的度量标准 线性组合 使用不同的聚类算法对实体属性进行聚类
14
实验评估 基于Dbpedia 和 YAGO 数据集搭建实验系统。 搭建对比系统: 基于属性分类的实体浏览系统; 基于属性聚类的实体浏览系统;
无属性分组的的实体浏览系统。
15
实验评估 对基于BMC模型的属性分配算法进行性能评测。 对获取的属性的附着类型进行评测
设计实验任务,让语义网开发者、用户参与实验,对各个实验系统进行评分与SUS测评。通过显 著性分析得出结论,证明我们的系统确实有利于用户获取实体信息,提高用户浏览体验。
16
Thank you! 在 “幻灯片放映”模式,单击箭头进入 PowerPoint 入门中心。
Similar presentations