基于知识图谱的关系概念化 Conceptualization of Relationship on Knowledge graph

Slides:



Advertisements
Similar presentations
控 江 路 街 道 2008 年暑期工作总结. 社区的暑期工作是学校教育的延伸和拓展,同时也是一项关系 到千家万户的民心工程。今年暑期,控江路街道在进一步落实 《中共中央国务院关于进一步加强和改进未成年人思想道德建 设的若干意见》的精神中,本着 “ 领导重视、学生喜欢、家长放 心 ” 的宗旨。以社区教育为阵地,整合各方资源,开展丰富多彩.
Advertisements

1 计算机软件考试命题模式 计算机软件考试命题模式 张 淑 平 张 淑 平. 2  命题模式内容  组织管理模式 − 命题机构和人员组成 − 命题程序  试卷组成模式.
数据结构的引入. 通讯录管理 社团机构管理 校园导航管理 通讯录管理 社团机构管理 校园导航管理.
故事背景家庭就是前陣子轟動大家小巷,每 個家庭主婦姊姊媽媽,都知道的女主角謝庵 真以及他的出軌老公溫蚋凡所發生的故事。 但這次要陳述的卻不是犀利大老婆,而是我 們的女二主角黎薇恩!在這個大老婆不受寵 小三當道的時代,到底這位小三界的大姐頭 如何以一句「不被愛的才是第三者」在人夫 界裡竄起?大老婆們又該如何防範這些威脅.
聚焦文化竞争力.
不花錢的養生:穴道按摩 D1 鼻竇 D2 耳朵 D3 肩膀 D4 肝臟 D5 膽 D6 腰部 D7 直腸 D8 眼瞼 D9 胃
現在最幸福 (Lee 上) 曹宇.
The Graduation Thesis Defense
宜蘭縣立復興國民中學 九十四學年度第一學期期末 校務會議工作報告.
概其要、析其理 ——议论文事实论据修改 昌平二中 王丽娟
从阿拉法特的脑死亡说开去.
“悦”读,飞越 “考场” 心神飞越 温州中学 郑可菜.
水上安全與救生 指導教授:劉秀麗教授 組  員:蔡 銀 展 黃 筱 青.
教育部101年度高級中等學校健康促進學校諮詢輔導簡報
我最喜愛的書本 班別:1D 班號:3 性名:陳嘉稀.
校園安全法律常識 莊美華 護 理 師.
張曼娟 12523王勻庭 12524陳宥蓉.
第陸章 溺水的預防與急救.
我們最常去的地方還是我的故鄉苗栗, 您知道春天的樟樹是什麼香味嗎?
对 培训者 培训的理解 丁革建
組員:楊佳宴、程莉涵、鄭婷方、簡國庭、許景惠
国际化的形象健康管理技能人才 面对新型市场化需求的挑战和机遇 William Lee
98年台中縣健康促進學校推動方向和重點 報告人:萬豐國小護理師吳妙純.
生命的覺醒.
華夏科技大學104學年度第1學期 地震避難掩護演練及複合式防災教育
第四次大作业 登陆学校图书馆网站的电子数据库
屏東縣105年度 友善校園事務與輔導工作- 國中適性輔導工作專業知能研習(初階課程) 桌遊在班級經營與學生輔導 之應用與連結
全国计算机等级考试 二级基础知识 第二章 程序设计基础.
醫務社會工作 吳慧美 社工師.
Harvard ManageMentor®
几个恒星形成团块中的CS分子激发温度的迭代计算
中国科学技术大学计算机系 陈香兰(0551- ) Spring 2009
《编译原理与技术》 期末复习 计算机科学与技术学院 郑启龙 李 诚 25/12/2018.
湖南大学-信息科学与工程学院-计算机与科学系
WSDM见闻 程龚.
京师数学大讲坛 第六讲 北京师范大学 数学科学学院
姓名XXX.
The Graduation Thesis Defense
一个RDF数据自然语言生成器的设计与实现
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
C++语言程序设计 C++语言程序设计 第七章 类与对象 第十一组 C++语言程序设计.
毕业论文答辩 答辩学生:宝藏PPT 指导老师:XXX.
C语言程序设计 主讲教师:陆幼利.
中国XX大学 毕业答辩模板 此模板可用于本科毕业答辩/硕士毕业答辩/学术研究等.
A GRADUATION THESIS REPLY TEMPLATE
作业情况 已交作业人数:140人 凡是自己没有交过作业的同学,课后留下,有话要说。 2. 文件名范例: 姓名:王树武 wshw_1.c
SView /4/16.
VisComposer 2019/4/17.
重估價模式 如果一項不動產丶廠房及設備的公允價值能可靠地衡量,則企業可以選用重估價模式作為後續衡量的會計政策。 採重估價模式其帳面金額為:
K1 雨巷——戴望舒.
实体描述呈现方法的研究 实验评估 2019/5/1.
中国风背景论文答辩模板 某大学某某信息学院 答辩学生:代用名 指导老师:代用名 答辩时间:201X年1月30日
人骨法器.
论文绪论 研究背景 研究方法 研究结果 问题讨论 论文总结 毕业答辩PPT模板 点击此处添加副标题 答辩人: XXX 指导老师: XX教授.
基于知识库对自然语言中属性取值对的探索 潘笑吟.
iSIGHT 基本培训 使用 Excel的栅栏问题
数据集的抽取式摘要 程龚, 徐丹云.
第八章 循序邏輯設計 台北市私立景文高級中學 資電學程 8-1 狀態圖及狀態表的建立 8-2 狀態表化簡 8-3 以各類型的正反器完成設計
计算机绘图 AutoCAD2016.
主讲教师 欧阳丹彤 吉林大学计算机科学与技术学院
基于列存储的RDF数据管理 朱敏
Adj + Noun映射到知识库中的classes
论文题目写在这里 题目太长分两行写也可以哦 - 国际经济与贸易 指导老师
受限超对称模型中Higgs粒子性质研究 曹 俊 杰 河南师范大学 北京大学高能中心 重庆,海峡两岸会议,2012年5月 基于工作:
毕业论文 答辩模版 The Graduation Thesis Plea of XXX university 答辩人:XXX
学习数据结构的意义 (C语言版) 《数据结构》在线开放课程 主讲人:李刚
入侵检测技术 大连理工大学软件学院 毕玲.
高中物理“平抛运动的应用” 点评专家:谭一宁.
毕业论文答辩模版 电子信息专业 2015级本科08班 北京大学 论文宝 答辩人: 教授 导师: 深蓝与灰白搭配 简洁严谨学术风格
毕业论文答辩模版 北京大学 某某某某专业 2015级本科08班 论文宝 答辩人: 教授 导师: Peking University
Presentation transcript:

基于知识图谱的关系概念化 Conceptualization of Relationship on Knowledge graph 本科学位论文 答辩报告 院系:软件学院 专业:软件工程 姓名:范思奇 导师:肖仰华 副教授

答辩提纲 研究背景 现有问题和启发 研究内容和方法 实验与分析 结论与讨论 致谢

研究背景 涉及问题:计算机如何理解关系? r(ei, ej) 表格标注(Table Annotation) 关系分类体系(Relation Taxonomy) A B Harry Potter J.K. Rowling Heal the World Michael Jackson The Wedding Banquet Ang Lee The Angelic Conversation William Shakespe … 涉及问题:计算机如何理解关系? r(ei, ej)

located-in (Fudan University, Shanghai) 研究背景 背景(1.1) 知识图谱(Knowledge graph)是一种结构化的信息,本质上是一种语义网。 构建:实体为结点,关系为边 维护:三元组为储存形式 located-in (Fudan University, Shanghai) 实体关系(1.1.2, 1.1.3) 实体关系有多种描述方式: 关系模式(Relation Pattern): 形式为<type> context <type> 如<Institution> locates at <Location> 关系实例(Relation Instance): 形式即为三元组r(ei, ej) 如 located-in (Fudan University, Shanghai) SOL模板 如<Person>’s [adj] voice * <Song>

现有问题和启发 现有的关系理解的局限性(2.2.2): 概念分类体系(3.1.1) 如何从细粒度、语义角度描述关系的特征? 基于本体(Ontology),类型有限 实体类型粒度粗,只能针对一对特定类型下的关系 基于句法特征 如何从细粒度、语义角度描述关系的特征? 概念分类体系(3.1.1) 微软亚研提出的Probase 概念-实体:概念是实体的抽象表示,实体是概念的具象实例 自动构建的isA(entity, concept)关系: isA(Harvard, Institution), isA(Massachusetts, Location) isA(Harvard, Ivy University), isA(Massachusetts, American State) <type> context <type> 类型有限 粒度粗 句法特征 located-in(Harvard, Massachusetts) Institution Ivy University Location American State isA 自动构建 语义特征 粒度细

研究内容和方法 关系分类体系为实体关系的理解提供了新思路(3.1.2): 使用概念(concept)优势(3.1.2): writer 实体关系:实体关系实际上是对许多实体对(entity pair)的抽象表示 因此,一组由许多实体对抽象化得到的概念对(concept pair)可以用于表示某种关系 使用概念(concept)优势(3.1.2): 实体对集合压缩为较小的概念对集合 相比本体类别(owl:type):概念体系是自动构建的,数量大,粒度细 相比分类(Category):isA关系具有传递性 (Harry Potter, J.K. Rowling), (The Angelic Conversation, William Shakespeare) (Crouching Tiger Hidden Dragon, Ang Lee), (Heal the World, Michael Jackson), … {(Song, Artist), (Film, Director), (Book, Writer)} writer

研究内容和方法 研究目标(3.2.1): 难点(3.2.2): 关系概念化:给定关系r,输入n个实体对E(r),输出m个概念对CP(r) 概念对是未知的 概念对的典型性 数据偏移 噪音 (Harry Potter, J.K. Rowling), (The Angelic Conversation, William Shakespeare) (Crouching Tiger Hidden Dragon, Ang Lee), (Heal the World, Michael Jackson), … {(Song, Artist), (Film, Director), (Book, Writer)} writer r CP(r) E(r)

研究内容和方法 算法设计(3.3): 概念对是未知的 概念对的典型性 数据偏移 噪音

研究内容和方法 1. 概念对生成(3.3.1) 输入:知识图谱中关系r的所有实体对E(r) 输出:Top-K候选概念对 1.1 由概念分类体系生成概念对空间C×C 1.2 由E(r)为概念对进行排序 边权值累计过程图例

研究内容和方法 1. 概念对生成(3.3.1) 输入:知识图谱中关系r的所有实体对E(r) 输出:Top-K候选概念对 1.1 由概念分类体系生成概念对空间C×C 1.2 由E(r)为概念对进行排序 关系writer的候选概念对集合ICW值分布

研究内容和方法 2. 聚类压缩(3.3.2) 输入:候选概念对 输出:一组概念对CP(r) 2.1 生成以概念对为点,相似度为边权的无向有权图 2.2 马尔科夫聚类算法聚类 2.3选择簇和代表概念对 一个概念对(ci,cj)对应的一个实体对集合EPr(ci,cj): 相似度定义:

研究内容和方法 2. 聚类压缩(3.3.2) 输入:候选概念对 输出:一组概念对CP(r) 2.1 生成以概念对为点,相似度为边权的无向有权图 2.2 马尔科夫聚类算法聚类 2.3选择簇和代表概念对 根据ICW累积权值和Wilson Score制定概念对代表性分数: 聚类后关系writer的候选概念对集合ICW值分布

实验与分析 数据集(4.1):DBpedia提供关系r和实体对E(r), Probase提供概念分类体系即isA关系 准确率(4.2):比较DBpedia的Romain-Range 与PATTY比较 WKP Top-100 Pattern YAGO 0.95±0.04 Freebase 0.93±0.05 WKP+Probase Top-3 Top2 Cover Top-100 of PATTY 1.23 0.72 Precision 0.93±0.04 0.96±0.04

实验与分析 聚类评估(4.3):人工构造实体对集合,每个集合有2或3个关系组成,评估方法是否能够将这些关系分为不同的簇。 质量评估(4.4):人工打分,计算MAP

结论与讨论 本文应用概念分类体系,提出两步抽象自下而上的关系概念化方法,根据概念的典型性、多样性、覆盖率等特征为一个实体关系给出一组Top-K的概念对。 特点: 使用实体类型更丰富的概念分类体系 将一对实体或一对概念当做一个对象来考虑,从而保留了一对实体或概念之间潜在的实体关系,通过大量实体对的叠加优化而选择更典型的概念对 优势:生成实体类型粒度更细的实体关系,有助于基于语义的关系分类体系的构建,也有助于发现更细的实体类型之间的新关系 应用: 基于语义的关系分类体系 基于语义关系的模板匹配

致谢 感谢我的导师,计算机科学与技术学院的肖仰华老师,在这几个月期间的认真指导。感谢韩国浦项科技大学(POSTECH)计算机系的Seungwon Hwang老师,在我的研究过程遇到瓶颈时提供建议。感谢计算机科学与技术学院的张义同学,在论文撰写期间全程为我提供帮助。感谢GDM实验室的各位同学,包括孙祥彦、谢晨昊同学等,在讨论中为我提供了有价值的资源。感谢我的母亲及其同学与同事、美国明尼苏达双城大学陈柯栋同学、复旦大学瞿佳庆同学、雷添羽同学、舒静同学、美国南加州大学马帅同学、云南师范大学计算机学院肖斓楠老师即其计算机学院的学生等,为我的实验进行了人工打分标注。 这篇论文将为我在复旦大学四年的学习与生活画上句号,因此我倾注了许多时间与精力。在接下来的几个月时间,我还将继续在肖仰华老师、Seungwon Hwang老师和张义同学的帮助下继续修改论文并投稿。 最后向审阅论文的各位专家和老师表示感谢,初次接触科研,论文中如有不足之处,敬请各位提出指正和建议。