数据摘要现状调研报告 上下文摘要初步思考 徐丹云.

Slides:



Advertisements
Similar presentations
洞庭月,衡岳云,巫山雨, 波撼气蒸,揽天下风光,堪 称独步; 崔灏诗,范相记,王勃序, 两楼一阁,数江南文物,各 有千秋。
Advertisements

FREE-TYPE POEM GENERATION QIXIN WANG, TIANYI LUO, DONG WANG, CHAO XING AAAI & IJCAI 2016.
教室走察的基本概念 Walk-Through
面向知识图谱的搜索技术 张坤 搜狗搜索.
Study of the AMS-02 results
詹天佑 詹天佑(1861—1919),江西婺wu源人。我国杰出的爱国工程师、铁路工程专家。毕业于美国耶鲁大学。他是中国首位铁路工程师,负责修建了京张铁路(北京——张家口)等铁路工程,有“中国铁路之父”、“中国近代工程之父”之称。
小学语文常用说明方法 广州市越秀区云山小学 高年级 李晓泓.
Classification of Web Query Intent Using Encyclopedia 基于百科知识的查询意图获取
------全国教育科学规划办公室 吴键 副研究员
天文学信息化建设初步设想 赵永恒 国家天文台 2006年11月.
天净沙·秋思 马致远 枯藤老树昏鸦, 小桥流水人家, 古道西风瘦马。 夕阳西下, 断肠人在天涯。
形神兼备,写活人物 ——外貌描写写作指导 丰县华山初级中学 王艳丽.
人工智能 Artificial Intelligence 第十一章
資料庫設計 Database Design.
Homework 2 : VSM and Summary
班级小插曲.
大数据在医疗行业的应用.
Semantic-Synaptic Web Mining: A Novel Model for Improving the Web Mining 報告者:陳宜樺 報告日期:2015/9/25.
A Question Answering Approach to Emotion Cause Extraction
Large-Scale Malware Indexing Using Function-Call Graphs
數位典藏 - 全文檢索系統簡介 Reporter:Chia-Hao Lee
词汇语义资源在中文关系抽取中的应用 报告人:钱龙华 刘丹丹 胡亚楠 钱龙华 周国栋
CCF ADL66大数据管理系统和技术 刘达欣 2018/11/28.
CCF-ADL 58 大媒体与大数据分析 北京·清华大学
关于“理解名词短语”的 重新思考 丁文韬.
文字探勘與知識工程 Text Mining & Knowledge Engineering
Word-Entity Duet Representations for Document Ranking
DATASET 查询概念树 相关调研 2018/12/6 刘庆霞 Websoft NJU.
Data Mining 資料探勘 Introduction to Data Mining Min-Yuh Day 戴敏育
Omid Bakhshandeh and James F. Allen IWCS 2015
資料庫系統導論.
药物和疾病啥关系 ? 李智恒.
基于语义网的军事问答系统的设计与实现 报告人:汤顺雷 指导老师:程龚.
Symbolic Execution During Test Data Generation and Augmentation Top Paper Review Zhiyi Zhang.
碳汇资本在旅游融资中的应用研究 阚如良 梅雪 孔婷 经济与管理学院旅游管理系
从百科类网站抽取infobox 报告人:徐波.
出 师 表 诸葛亮.
Abstract Data Types 抽象数据类型 Institute of Computer Software 2019/2/24
—— 周小多.
Meaningful Compound Concept Learning?
ISWC2014见闻 程龚.
Answering aggregation question over knowledge base
研究技巧與論文撰寫方法 中央大學資管系 陳彥良.
基于MapReduce的大规模本体匹配方法研究
模式识别与智能系统研究中心介绍 2017年8月.
Total Review of Data Structures
相關統計觀念復習 Review II.
遠 流 商 用 英 語 學 程 主講人:陳世宗先生 地 點:清雲科技大學 (清雲館804教室) 日 期:
Why Semantic Web? Speaker: 呂瑞麟 國立中興大學資訊管理學系教授
Learn Question Focus and Dependency Relations from Web Search Results for Question Classification 各位老師大家好,這是我今天要報告的論文題目,…… 那在題目上的括號是因為,前陣子我們有投airs的paper,那有reviewer對model的名稱產生意見.
Representation Learning of Knowledge Graphs with Hierarchical Types
與傳媒共舞四大重點 李燦榮
A Data Mining Algorithm for Generalized Web Prefetching
知識管理 第二章 本體論為基礎的知識.
Efficient Query Relaxation for Complex Relationship Search on Graph Data 李舒馨
异构数据源集成工具包及其在生物医学领域的应用
PowerPoint Template.
More About Auto-encoder
慈濟大學 研究發展處 業務簡介 1. 為規劃校務發展、推動學術研究、整合校內資源,特依大學法第十四條及本校組織規程第六條之規定,設置研究發展處。(96.8.1設立) 2. 掌管校務發展規劃, 學術研究事務等相關業務。 101 新進人員講習.
Turtle规范报告
钱炘祺 一种面向实体浏览中属性融合的人机交互的设计与实现 Designing Human-Computer Interaction of Property Consolidation for Entity Browsing 钱炘祺
玉泉校区教八107室 2008年1月10日(星期四)上午10:0011:30
以碎形正交基底和時間情境圖為基礎進行之視訊檢索 Video retrieval based on fractal orthogonal bases and temporal graph 阿凡達 研究生:張敏倫 指導教授:蔣依吾博士 國立中山大學資訊工程學系.
陳昭珍 國立臺灣師範大學圖書資訊學研究所副教授
DATASET 0.2 设计方案 (第一阶段) 2019/7/20 刘庆霞 Websoft NJU.
地点识别调研 施林锋.
Homework 2 : VSM and Summary
Sparql Query Log 分析初步 Jiwei Ding present.
Self-Attention huitr
知之为知之,不知为不知,是知也。 ——孔子. 知之为知之,不知为不知,是知也。 ——孔子 孙中山是中国民主主义革命先行者,被后人称国父。 1911年辛亥革命后被十七省代表推荐为中华民国临时大总统。
Presentation transcript:

数据摘要现状调研报告 上下文摘要初步思考 徐丹云

数据摘要分类 实体摘要 面向查询的摘要 上下文有关摘要 一般性摘要 本体摘要 抽取术语 抽取句子 RDF图摘要 模式抽取 顶点聚类

实体摘要-面向查询 和查询的相关性 Bai X, Delbru R, Tummarello G. RDF snippets for Semantic Web search engines topic-related node + query-related node+启发性算法排序 Cheng G, Qu Y. Searching linked objects with falcons: Approach, implementation and evaluation 词向量+余弦相似度 Zhang L, Zhang Y, Chen Y. Summarizing highly structured documents for effective search interaction 机器学习方法计算Facet-value和query的相关度

实体摘要-上下文感知 Tonon A, Catasta M, Demartini G, et al. TRank: Ranking Entity Types Using the Web of Data Type出现的频率 上下文中提到的实体 Type的层次结构

实体摘要-一般性 单步摘要 Cheng G, Tran T, Qu Y. RELIN: relatedness and informativeness-based centrality for entity summarization 随机冲浪模型 两个Feature的相关度(搜索引擎搜索共同出现的次数) Feature的信息量(数据集中出现的次数) Thalhammer A, Toma I, Roa-Valverde A, et al. Leveraging usage data for linked data movie entity summarization K近邻 Feature分数计算(与k个近邻共享的feature) 选择前n个feature

实体摘要-一般性 多步摘要 Fakas G J, Cai Z, Mamoulis N. Size-l object summaries for relational keyword 优化问题(动态规划,贪心算法) 每个元组重要性,最大化 Sydow M, Pikuła M, Schenkel R. The notion of diversity in graphical entity summarisation on semantic knowledge graphs relevance+importance+popularity+diversity

实体摘要-总结 统计信息 信息量,流行度等 特定应用相关信息 相关度 图结构重要性 图算法

本体摘要-抽取术语 Zhang X, Li H, Qu Y. Finding important vocabulary within ontology Vocabulary Dependency Graph+vocabulary和ontology的相似度+Double Focused PageRank算法(concepts+relations) Wu G, Li J, Feng L, et al. Identifying potentially important concepts and relations in an ontology CARRank算法的四个原则,迭代(concepts+relations) A concept is more important if there are more relations starting from the concepts A concept is more important if there is a relation starting from the concept to a more important concept A concept is more important if it has a higher relation weight to any other concept A relation weight is higher if it starts from a more import concept

本体摘要-抽取句子 -概念以及概念之间的关系 Zhang X, Cheng G, Qu Y. Ontology summarization based on rdf sentence graph RDF Sentence Graph+RDF句子的“Centrality” Degree Centrality Between Centrality Eigenvector Centrality(PageRank,HITS) Zhang X, Cheng G, Ge W Y, et al. Summarizing vocabularies in the global semantic web Expanded Bipartite Graph+Weighted HITS算法(结构上的重要程度) 包含的terms的平均重要程度(语用学上的重要性) Cheng G, Ji F, Luo S, et al. BipRank: ranking and summarizing RDF vocabulary descriptions A bipartite graph(sentence-item graph) Random walk

本体摘要-总结 构造图 图算法

RDF图摘要-抽取模式 Basse A, Gandon F, Mirbel I, et al. DFS-based frequent graph pattern extraction to characterize the content of RDF Triple Stores DFS编码代表rdf图模式+递归 Presutti12 V, Aroyo L, Adamou12 A, et al. Extracting core knowledge from Linked Data Dataset knowledge architecture+统计分析+between centrality

RDF图摘要-顶点聚类

RDF图摘要-顶点聚类 等价关系,划分 Tian Y, Hankins R A, Patel J M. Efficient aggregation for graph summarization 根据用户选择的属性和关系 Campinas S, Perry T E, Ceccarelli D, et al. Introducing rdf graph summary with application to assisted sparql formulation 同类型+相似的属性 Campinas S, Delbru R, Tummarello G. Efficiency and precision trade-offs in graph summary algorithms 至少有同一种类型,所有类型相同,有相同属性

下阶段工作 上下文感知摘要

上下文有关摘要 图算法 自然语言处理 只有考虑对type排序 只利用上下文的entity 邻居实体 TRank Leveraging usage。。。 只有考虑对type排序 只利用上下文的entity 邻居实体 图算法 自然语言处理

Thanks