空间元素抽取及其 关系识别 施林锋
大纲 任务介绍 数据集 研究现状 计划
任务介绍 空间元素抽取 Place, Path, Spatial Entity, Motion, Spatial Signal, Motion Signal, Non-motion Event 空间关系识别 拓扑关系 QSLink 相对方位关系 OLink 运动关系 MoveLink 距离关系 MLink
任务介绍 三种测试数据配置 主要任务 配置一:所有数据没有任何标注 配置二:空间元素已经标注 配置三:空间元素及其属性已经标注 空间元素边界识别 空间元素边界及类型识别 空间元素边界、类型及属性识别 空间关系识别 空间关系及属性识别
例子 Just south of Ginza itself, as you walk toward the bay, you see on your left the red lanterns and long banners of the Kabuki-za… Place Ginza, bay, left, Kabuki-za Spatial Entity you, lanterns, banners Spatial Signal south of, on Motion walk Motion Signal toward MoveLink <mover=you, tigger=walk, goal=bay, motion_signal=toward> QSLink <trajector=laterns, trigger=on, landmark=left> OLink <trajector=NULL, trigger=south of, landmark=Ginza>
数据集 Degree Confluence Project (DCP) American National Corpus (ANC) SpaceBank corpus的一部分 American National Corpus (ANC) Berlitz Travel Guides Ride for Climate (RFC) Travel weblog
研究现状 空间元素抽取 结果 CRF:一个或者多个 (Baseline,SpRL-CWW, Korean) 词表+分类器 (IXA) 利用WordNet, PropBank等外部资源,建立每种元素的 domain 产生的候选较多,利用分类器判断是否为最终答案 结果
研究现状 空间关系识别 结果 Pipeline(Rule-Based):(Baseline,Korean,IXA) 首先识别出关系的触发词 然后根据一系列规则,识别出关系的其他成分 Joint:将关系识别作为二分类问题(Sieve-Based, UTD,SpRL-CWW) 枚举空间元素可能的所有组合 每种组合通过一个二分类器判断是否为关系 贝叶斯模型:依存树和关系(Korean) 每个空间元素和依存树结构的先验概率 结果
其他 CLEF 2017 Multimodal Spatial Role Labeling 原来的问题难度较大 训练数据量少 存在较大歧义 引入图片,通过加入图片信息来帮助抽取关系 结果更差!
计划 聚焦任务 数据准备 方法探索 关系识别 SpaceEval 2015提供的数据集 复现 改进,重新设计 OSLINK, OLINK, MLINK, MOVELINK 数据准备 SpaceEval 2015提供的数据集 方法探索 复现 改进,重新设计