基于知识图谱的关系概念化 Conceptualization of Relationship on Knowledge graph

Slides:

Advertisements

Similar presentations

控江路街道 2008 年暑期工作总结. 社区的暑期工作是学校教育的延伸和拓展，同时也是一项关系到千家万户的民心工程。今年暑期，控江路街道在进一步落实《中共中央国务院关于进一步加强和改进未成年人思想道德建设的若干意见》的精神中，本着 “ 领导重视、学生喜欢、家长放心 ” 的宗旨。以社区教育为阵地，整合各方资源，开展丰富多彩.

Advertisements

1 计算机软件考试命题模式计算机软件考试命题模式张淑平张淑平. 2  命题模式内容  组织管理模式 − 命题机构和人员组成 − 命题程序  试卷组成模式.

数据结构的引入. 通讯录管理社团机构管理校园导航管理通讯录管理社团机构管理校园导航管理.

故事背景家庭就是前陣子轟動大家小巷，每個家庭主婦姊姊媽媽，都知道的女主角謝庵真以及他的出軌老公溫蚋凡所發生的故事。但這次要陳述的卻不是犀利大老婆，而是我們的女二主角黎薇恩！在這個大老婆不受寵小三當道的時代，到底這位小三界的大姐頭如何以一句「不被愛的才是第三者」在人夫界裡竄起？大老婆們又該如何防範這些威脅.

聚焦文化竞争力.

不花錢的養生:穴道按摩 D1 鼻竇 D2 耳朵 D3 肩膀 D4 肝臟 D5 膽 D6 腰部 D7 直腸 D8 眼瞼 D9 胃

現在最幸福 (Lee 上) 曹宇.

The Graduation Thesis Defense

宜蘭縣立復興國民中學九十四學年度第一學期期末校務會議工作報告.

概其要、析其理 ——议论文事实论据修改昌平二中王丽娟

从阿拉法特的脑死亡说开去.

“悦”读，飞越 “考场” 心神飞越温州中学郑可菜.

水上安全與救生指導教授：劉秀麗教授組　　員：蔡銀展黃筱青.

教育部101年度高級中等學校健康促進學校諮詢輔導簡報

我最喜愛的書本班別:1D 班號:3 性名:陳嘉稀.

校園安全法律常識莊美華護理師.

張曼娟 12523王勻庭 12524陳宥蓉.

第陸章溺水的預防與急救.

我們最常去的地方還是我的故鄉苗栗, 您知道春天的樟樹是什麼香味嗎？

对培训者培训的理解丁革建

組員：楊佳宴、程莉涵、鄭婷方、簡國庭、許景惠

国际化的形象健康管理技能人才面对新型市场化需求的挑战和机遇 William Lee

98年台中縣健康促進學校推動方向和重點報告人:萬豐國小護理師吳妙純.

生命的覺醒.

華夏科技大學104學年度第1學期地震避難掩護演練及複合式防災教育

第四次大作业登陆学校图书馆网站的电子数据库

屏東縣105年度友善校園事務與輔導工作- 國中適性輔導工作專業知能研習(初階課程) 桌遊在班級經營與學生輔導之應用與連結

全国计算机等级考试二级基础知识第二章程序设计基础.

醫務社會工作吳慧美社工師.

Harvard ManageMentor®

几个恒星形成团块中的CS分子激发温度的迭代计算

中国科学技术大学计算机系陈香兰（0551－） Spring 2009

《编译原理与技术》期末复习计算机科学与技术学院郑启龙李诚 25/12/2018.

湖南大学-信息科学与工程学院-计算机与科学系

WSDM见闻程龚.

京师数学大讲坛第六讲北京师范大学数学科学学院

The Graduation Thesis Defense

一个RDF数据自然语言生成器的设计与实现

第4章非线性规划 4.5 约束最优化方法 2019/4/6 山东大学软件学院.

C++语言程序设计 C++语言程序设计第七章类与对象第十一组 C++语言程序设计.

毕业论文答辩答辩学生：宝藏PPT 指导老师：XXX.

C语言程序设计主讲教师：陆幼利.

中国XX大学毕业答辩模板此模板可用于本科毕业答辩/硕士毕业答辩/学术研究等.

A GRADUATION THESIS REPLY TEMPLATE

作业情况已交作业人数：140人凡是自己没有交过作业的同学，课后留下，有话要说。 2. 文件名范例：姓名：王树武 wshw_1.c

VisComposer 2019/4/17.

重估價模式如果一項不動產丶廠房及設備的公允價值能可靠地衡量，則企業可以選用重估價模式作為後續衡量的會計政策。採重估價模式其帳面金額為:

K1 雨巷——戴望舒.

实体描述呈现方法的研究实验评估 2019/5/1.

中国风背景论文答辩模板某大学某某信息学院答辩学生：代用名指导老师：代用名答辩时间：201X年1月30日

论文绪论研究背景研究方法研究结果问题讨论论文总结毕业答辩PPT模板点击此处添加副标题答辩人： XXX 指导老师： XX教授.

基于知识库对自然语言中属性取值对的探索潘笑吟.

iSIGHT 基本培训使用 Excel的栅栏问题

数据集的抽取式摘要程龚, 徐丹云.

第八章循序邏輯設計台北市私立景文高級中學資電學程 8-1 狀態圖及狀態表的建立 8-2 狀態表化簡 8-3 以各類型的正反器完成設計

计算机绘图 AutoCAD2016.

主讲教师欧阳丹彤吉林大学计算机科学与技术学院

基于列存储的RDF数据管理朱敏

Adj + Noun映射到知识库中的classes

论文题目写在这里题目太长分两行写也可以哦 - 国际经济与贸易指导老师

受限超对称模型中Higgs粒子性质研究曹俊杰河南师范大学北京大学高能中心重庆，海峡两岸会议，2012年5月基于工作：

毕业论文答辩模版 The Graduation Thesis Plea of XXX university 答辩人：XXX

学习数据结构的意义（C语言版）《数据结构》在线开放课程主讲人：李刚

入侵检测技术大连理工大学软件学院毕玲.

高中物理“平抛运动的应用” 点评专家：谭一宁.

毕业论文答辩模版电子信息专业 2015级本科08班北京大学论文宝答辩人：教授导师：深蓝与灰白搭配简洁严谨学术风格

毕业论文答辩模版北京大学某某某某专业 2015级本科08班论文宝答辩人：教授导师： Peking University

Presentation transcript:

基于知识图谱的关系概念化 Conceptualization of Relationship on Knowledge graph 本科学位论文答辩报告院系：软件学院专业：软件工程姓名：范思奇导师：肖仰华副教授

答辩提纲研究背景现有问题和启发研究内容和方法实验与分析结论与讨论致谢

研究背景涉及问题：计算机如何理解关系？ r(ei, ej) 表格标注(Table Annotation) 关系分类体系(Relation Taxonomy) A B Harry Potter J.K. Rowling Heal the World Michael Jackson The Wedding Banquet Ang Lee The Angelic Conversation William Shakespe … 涉及问题：计算机如何理解关系？ r(ei, ej)

located-in (Fudan University, Shanghai) 研究背景背景(1.1) 知识图谱(Knowledge graph)是一种结构化的信息，本质上是一种语义网。构建：实体为结点，关系为边维护：三元组为储存形式 located-in (Fudan University, Shanghai) 实体关系(1.1.2, 1.1.3) 实体关系有多种描述方式：关系模式(Relation Pattern)：形式为<type> context <type> 如<Institution> locates at <Location> 关系实例(Relation Instance)：形式即为三元组r(ei, ej) 如 located-in (Fudan University, Shanghai) SOL模板如<Person>’s [adj] voice * <Song>

现有问题和启发现有的关系理解的局限性(2.2.2)：概念分类体系(3.1.1) 如何从细粒度、语义角度描述关系的特征？基于本体(Ontology)，类型有限实体类型粒度粗，只能针对一对特定类型下的关系基于句法特征如何从细粒度、语义角度描述关系的特征？概念分类体系(3.1.1) 微软亚研提出的Probase 概念-实体：概念是实体的抽象表示，实体是概念的具象实例自动构建的isA(entity, concept)关系： isA(Harvard, Institution), isA(Massachusetts, Location) isA(Harvard, Ivy University), isA(Massachusetts, American State) <type> context <type> 类型有限粒度粗句法特征 located-in(Harvard, Massachusetts) Institution Ivy University Location American State isA 自动构建语义特征粒度细

研究内容和方法关系分类体系为实体关系的理解提供了新思路(3.1.2)：使用概念(concept)优势(3.1.2)： writer 实体关系：实体关系实际上是对许多实体对(entity pair)的抽象表示因此，一组由许多实体对抽象化得到的概念对(concept pair)可以用于表示某种关系使用概念(concept)优势(3.1.2)：实体对集合压缩为较小的概念对集合相比本体类别(owl:type)：概念体系是自动构建的，数量大，粒度细相比分类(Category)：isA关系具有传递性 (Harry Potter, J.K. Rowling), (The Angelic Conversation, William Shakespeare) (Crouching Tiger Hidden Dragon, Ang Lee), (Heal the World, Michael Jackson), … {(Song, Artist), (Film, Director), (Book, Writer)} writer

研究内容和方法研究目标(3.2.1)：难点(3.2.2)：关系概念化：给定关系r，输入n个实体对E(r)，输出m个概念对CP(r) 概念对是未知的概念对的典型性数据偏移噪音 (Harry Potter, J.K. Rowling), (The Angelic Conversation, William Shakespeare) (Crouching Tiger Hidden Dragon, Ang Lee), (Heal the World, Michael Jackson), … {(Song, Artist), (Film, Director), (Book, Writer)} writer r CP(r) E(r)

研究内容和方法算法设计(3.3)：概念对是未知的概念对的典型性数据偏移噪音

研究内容和方法 1. 概念对生成(3.3.1) 输入：知识图谱中关系r的所有实体对E(r) 输出：Top-K候选概念对 1.1 由概念分类体系生成概念对空间C×C 1.2 由E(r)为概念对进行排序边权值累计过程图例

研究内容和方法 1. 概念对生成(3.3.1) 输入：知识图谱中关系r的所有实体对E(r) 输出：Top-K候选概念对 1.1 由概念分类体系生成概念对空间C×C 1.2 由E(r)为概念对进行排序关系writer的候选概念对集合ICW值分布

研究内容和方法 2. 聚类压缩(3.3.2) 输入：候选概念对输出：一组概念对CP(r) 2.1 生成以概念对为点，相似度为边权的无向有权图 2.2 马尔科夫聚类算法聚类 2.3选择簇和代表概念对一个概念对(ci,cj)对应的一个实体对集合EPr(ci,cj)：相似度定义：

研究内容和方法 2. 聚类压缩(3.3.2) 输入：候选概念对输出：一组概念对CP(r) 2.1 生成以概念对为点，相似度为边权的无向有权图 2.2 马尔科夫聚类算法聚类 2.3选择簇和代表概念对根据ICW累积权值和Wilson Score制定概念对代表性分数：聚类后关系writer的候选概念对集合ICW值分布

实验与分析数据集(4.1)：DBpedia提供关系r和实体对E(r), Probase提供概念分类体系即isA关系准确率(4.2)：比较DBpedia的Romain-Range 与PATTY比较 WKP Top-100 Pattern YAGO 0.95±0.04 Freebase 0.93±0.05 WKP+Probase Top-3 Top2 Cover Top-100 of PATTY 1.23 0.72 Precision 0.93±0.04 0.96±0.04

实验与分析聚类评估(4.3)：人工构造实体对集合，每个集合有2或3个关系组成，评估方法是否能够将这些关系分为不同的簇。质量评估(4.4)：人工打分，计算MAP

结论与讨论本文应用概念分类体系，提出两步抽象自下而上的关系概念化方法，根据概念的典型性、多样性、覆盖率等特征为一个实体关系给出一组Top-K的概念对。特点：使用实体类型更丰富的概念分类体系将一对实体或一对概念当做一个对象来考虑，从而保留了一对实体或概念之间潜在的实体关系，通过大量实体对的叠加优化而选择更典型的概念对优势：生成实体类型粒度更细的实体关系，有助于基于语义的关系分类体系的构建，也有助于发现更细的实体类型之间的新关系应用：基于语义的关系分类体系基于语义关系的模板匹配

致谢感谢我的导师，计算机科学与技术学院的肖仰华老师，在这几个月期间的认真指导。感谢韩国浦项科技大学（POSTECH）计算机系的Seungwon Hwang老师，在我的研究过程遇到瓶颈时提供建议。感谢计算机科学与技术学院的张义同学，在论文撰写期间全程为我提供帮助。感谢GDM实验室的各位同学，包括孙祥彦、谢晨昊同学等，在讨论中为我提供了有价值的资源。感谢我的母亲及其同学与同事、美国明尼苏达双城大学陈柯栋同学、复旦大学瞿佳庆同学、雷添羽同学、舒静同学、美国南加州大学马帅同学、云南师范大学计算机学院肖斓楠老师即其计算机学院的学生等，为我的实验进行了人工打分标注。这篇论文将为我在复旦大学四年的学习与生活画上句号，因此我倾注了许多时间与精力。在接下来的几个月时间，我还将继续在肖仰华老师、Seungwon Hwang老师和张义同学的帮助下继续修改论文并投稿。最后向审阅论文的各位专家和老师表示感谢，初次接触科研，论文中如有不足之处，敬请各位提出指正和建议。