DATASET 0.2 设计方案 (第一阶段) 2019/7/20 刘庆霞 Websoft Group @ NJU
背景 目标/原则: 为用户(专业or非专业)掌握所请求的RDF数据集 的内容提供一种恰当的方式 支持用户在RDF数据集上方便地构造和应用查询 内容完整,尽量减少整理过程中的数据丢失 呈现方式易于理解 支持用户在RDF数据集上方便地构造和应用查询 合理的交互方式 构造的查询具有适当的表达能力
基本框架 Web of Data 数据抓取 数据存储 数据整理 呈现 查询
数据集呈现 视图呈现 基于pattern的查询 以特殊的视图展现数据集经过整理后的内容 三部分内容: 交互式构造pattern产生查询结果 基本信息 摘要信息 content呈现 + class导航 基于pattern的查询 交互式构造pattern产生查询结果
视图呈现 基本信息 目的:表达数据集的元数据 内容: 标题 数据源列表 数据源uri、创建者、创建日期、版本信息、描述 Name of Dataset Sources: http://uri1 Creator: xxx Date: xxx Version: xxx Description: xxxxxxxxxxxxxxxxxxx http://uri2 lite full
视图呈现 摘要信息 对数据集内容的简要概括 包括: 常用类型、常用实体、数据规模 其中,频繁模式可用于后续的查询构造阶段 About: Person, Place, Music, Film …… Entities: Timberners Lee, Shanghai, Yesterday Once More …… Scale: has 234 triples, 93 sentences, 24 classes, 9 properties, 14 entities
视图呈现 Content呈现(基本同0.1) 目的 形式 block 呈现数据集所有内容 -“基本信息” block列表 呈现数据集所有内容 -“基本信息” 形式 block列表 block 具有相同subject的RDF Sentence排列显示在一块区域
视图呈现 Class导航 内容 树状结构 -- class继承关系 功能 点击class A 过滤出 subject∈A的所有block
基于Pattern的查询 生成 基本形式 约束或扩展 pattern的形式:节点之间根据遍历出的树结构进行组织 节点: 起点为任意一条triple pattern 用户逐步选择新的triple pattern对当前pattern进行 约束或扩展 用树的方式呈现triple pattern之间的关系 基本形式 pattern的形式:节点之间根据遍历出的树结构进行组织 节点: vi 扩展:增加新节点的vi的未访问邻边 vi的子节点 约束:vi与父节点或class的连边
基于Pattern的查询 列出所有供选择的triple pattern: C (u) ……. ④ ① ② ⑤ ⑥ ③ ⑦ ⑧ v u w Class C
基于Pattern的查询 pattern: u→ (p1,p2,p3) pattern: u→ (p1,p2,p3) C(u) C(u) v w Class C
基于Pattern的查询 pattern: u(p2,p3) → v →(p4,p5,p6) C(u) (u,p2,v) v u w Class C
基于Pattern的查询 pattern: u(p2) → v(p4,p5) →w →(p7,p8) C(u) (u,p2,v) (v,p6,w) ↓ (u,p3,w) v 与父节点相关联的边 u w Class C
基于Pattern的查询 pattern: u(p2) → v(p4,p5) →w →(p7,p8) C(u) (u,p2,v) (v,p6,w) (u,p3,w) v u w Class C
计划 时间安排: 2013.03.09-05.01 主要功能 其他功能 入口、基本信息、content呈现、class导航 摘要信息 导航/查询 Content呈现 Class Pattern 数据源推荐 查询推荐 时间安排: 2013.03.09-05.01 主要功能 入口、基本信息、content呈现、class导航 基于pattern的查询 其他功能 摘要呈现、源格式呈现
Thank You ~ Any suggestions?