Leveraging FrameNet to Improve Automatic Event Detection

Slides:



Advertisements
Similar presentations
四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
Advertisements

主编:邓萌 【点按任意键进入】 【第六单元】 教育口语. 幼儿教师教育口 语概论 模块一 幼儿教师教育口语 分类训练 模块二 适应不同对象的教 育口语 模块三 《幼儿教师口语》编写组.
第一組 加減法 思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.
海南医学院附 院妇产科教室 华少平 妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.
植树节的由来 植树节的意义 各国的植树节 纪念中山先生 植树节的由来 历史发展到今天, “ 植树造林,绿化祖国 ” 的热潮漫卷 了中华大地。从沿海到内地,从城市到乡村,涌现了多少 造林模范,留下了多少感人的故事。婴儿出世,父母栽一 棵小白怕,盼望孩子和小树一样浴光吮露,茁壮成长;男 女成婚,新人双双植一株嫩柳,象征家庭美满,幸福久长;
客户协议书 填写样本和说明 河南省郑州市金水路 299 号浦发国际金融中 心 13 层 吉林钰鸿国创贵金属经营有 限公司.
浙江省县级公立医院改革与剖析 马 进 上海交通大学公共卫生学院
第二章 环境.
教师招聘考试 政策解读 讲师:卢建鹏
了解语文课程的基本理念,把握语文素养的构成要素。 把握语文教育的特点,特别是开放而有活力的语文课程的特点。
北台小学 构建和谐师生关系 做幸福教师 2012—2013上职工大会.
福榮街官立小學 我家孩子上小一.
第2期技職教育再造方案(草案) 教育部 101年12月12日 1 1.
企业员工心态管理培训 企业员工心态管理培训讲师:谭小琥.
历史人物的研究 ----曾国藩 组员: 乔立蓉 杜曜芳 杨慧 组长:马学思 杜志丹 史敦慧 王晶.
教育部高职高专英语类专业教学指导委员会 刘黛琳 山东 • 二○一一年八月
淡雅诗韵 七(12)班 第二组 蔡聿桐.
第七届全国英语专业院长/系主任高级论坛 汇报材料
小數怕長計, 高糖飲品要節制 瑪麗醫院營養師 張桂嫦.
制冷和空调设备运用与维修专业 全日制2+1中等职业技术专业.
会计信息分析与运用 —浙江古越龙山酒股份有限公司财务分析 组员:2006级工商企业管理专业 金国芳 叶乐慧 魏观红 徐挺挺 虞琴琴.
第六章 人体生命活动的调节 人体对外界环境的感知.
芹菜 英语051班 9号 黄秋迎 概论:芹菜是常用蔬菜之一,既可热炒,又能凉拌,深受人们喜爱。近年来诸多研究表明,这是一种具有很好药用价值的植物。 别名:旱芹、样芹菜、药芹、香芹、蒲芹 。 芹菜属于花,芽及茎类。
2012年 学生党支部书记工作交流 大连理工大学 建工学部 孟秀英
北京市职业技能鉴定管理中心试题管理科.
2014吉林市卫生局事业单位招聘153名工作人员公告解读
各類所得扣繳法令 與申報實務 財政部北區國稅局桃園分局 103年9月25日
初級游泳教學.
爱国卫生工作的持续发展 区爱卫办 俞贞龙.
第八章 数学活动 方程组图象解法和实际应用
本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响. 本课内容提要 一、汇率的含义 二、汇率变化与币值的关系 三、汇率变化的影响.
散文鉴赏方法谈.
比亚迪集成创新模式探究 深圳大学2010届本科毕业论文答辩 姓名:卓华毅 专业:工商管理 学号: 指导老师:刘莉
如何撰写青年基金申请书 报 告 人: 吴 金 随.
点击输 入标题 点击输入说明性文字.
國際志工海外僑校服務 越南 國立臺中教育大學 2010年國際志工團隊.
痰 饮.
學分抵免原則及 學分抵免線上操作說明會.
教 学 查 房 黄宗海 南方医科大学第二临床医学院 外科学教研室.
评 建 工 作 安 排.
“十二五”国家科技计划经费管理改革培训 概预算申报与审批 国家科学技术部 2012年5月.
“十二五”国家科技计划经费管理改革培训 概预算申报与审批 国家科学技术部 2012年5月.
首都体育学院 武术与表演学院 张长念 太极拳技击运用之擒拿 首都体育学院 武术与表演学院 张长念
现行英语中考考试内容与形式的利与弊 黑龙江省教育学院 于 钢 2016, 07,黄山.
第5讲:比较安全学的创建 吴 超 教授 (O)
彰化縣西勢國小備課工作坊 新生入學的班級經營 主講:黃盈禎
重庆市西永组团K标准分区基本情况介绍.
西貢區歷史文化 清水灣 鍾礎營,楊柳鈞,林顥霖, 譚咏欣,陳昭龍.
所得稅扣繳法令與實務 財政部北區國稅局桃園分局 102年12月19日 1 1.
角 色 造 型 第四章 欧式卡通造型 主讲:李娜.
走进校园流行 高二15班政治组 指导老师:曾森治老师.
医院文化建设 广东省中医院 2011年3月26日.番禺.
案例:海底捞模式 ——把服务做到极致.
医疗法律法规培训 连云港市东辛农场医院 周卫平 二0一四年十二月.
史泰博出货检验员面试中·········
09英本2班 罗芬.
个人所得税 扣缴申报表填报讲解.
眼睛的守護者.
主講人:孫台義 教授 哈薩克大學國際關係學院 客座教授
土地增值税清算业务培训 主讲人:吴金娟 怀集地税.
实训报告 财务管理二班 第三小组 组长:董文芳 执笔人:王瑾 组员:汲伦 庞宁宁 姜美.
中信信诚-淮安项目.
造成近視的原因 一、外在環境:佔百分之七十 1. 飲食失調: __偏食引起。 __甜食過多。 __酸鹼度不平衡。  人體是弱鹼性,攝取過多酸性食物,也會近視。
SOA – Experiment 3: Web Services Composition Challenge
Online job scheduling in Distributed Machine Learning Clusters
基于规则抽取的 时间表达式识别.
iSIGHT 基本培训 使用 Excel的栅栏问题
基于规则抽取的时间表达式识别 -英文Ⅲ 高冠吉.
基于列存储的RDF数据管理 朱敏
Adj + Noun映射到知识库中的classes
Presentation transcript:

Leveraging FrameNet to Improve Automatic Event Detection 中国科学院自动化研究所 模式识别国家重点实验室 刘树林 陈玉博 何世柱 刘康 赵军

背景 FrameNet FrameNet 的理论基础是Frame Semantics, 该理论认为绝大部分词的 含义可以通过语义框架(Semantic Frame)来描述。语义框架:一个对事 件(event)、关系(Relation)或者实 体(Entity)的类型及其参与者 (Participants)的描述。 FrameNet的数据结构包括Frame、LU (Lexical Unit)、FE (Frame Element)和 Exemplar,Frame之间定义了八种关系。 FrameNet包含1000多个Frame ,10000多个LU和17000个标注例句 (exemplar)

背景 -ACE定义了八大类33小类的事件,事件由触发词(Trigger)和参与者 (Argument)组成,例如: ACE 恐怖分子于昨天袭击了叙利亚。 恐怖分子 昨天 袭击 叙利亚 Attacker Time Trigger of Attack Place -ACE包含599篇标注文档,约6000个标注的事件实例。

动机 - 事件识别面临严重的数据稀疏问题 - Frame和Event的相似性 由于事件结构的复杂性,标注成本极大,ACE定义了33类事件,却只 有599篇标注文档,尤其对于某些类型的事件,ACE语料只包含几个标 注实例,这样规模的数据显然很难训练得到令人满意的识别模型。 - Frame和Event的相似性 >结构的相似性 Frame由LU和FE构成,Event由Trigger和Argument构成 LU和Trigger功能类似 FE和Argument功能类似

动机 - Frame和Event的相似性 >内容的相似性 部分Frame确实表达了某种类型的事件。

动机 以上的观察促使我们探究如下两个问题: 如何在FrameNet语料上识别事件? a. Frame和Event之间是否存在比较好的对应关系 研究思路:通过Frame下的标注例句是否表达事件来判断Frame和Event之间的关系。 b. 是否可以利用FrameNet的数据提高事件识别的效果 研究思路:由上面分析可知,事件识别面临严重的数据稀疏问题,一个直接的利用FrameNet提高事 件识别性能的方法是利用FrameNet中的事件扩充ACE的数据,缓解数据稀疏问题。 如何在FrameNet语料上识别事件?

方法 在FrameNet语料上识别事件

方法 Basic ED Model 将事件识别建模为词分类的问题 -和普通的事件识别区别 a. 只将LU作为候选触发词 b. 跨领域问题 基于表示学习的模型能够很好的处理跨领域问题

方法 Basic ED Model 模型:三层全连接的神经网络(输入层、隐藏层、输出层) 输入:候选词的词向量+当前句子包含词的平均向量 词向量来源:使用word2vec工具在NYT语料上训练获得。

方法 PSL Model Basic ED 模型对FrameNet中的事件进行初步识别,利用PSL融合初 步识别的结果和三条全局限制,推理得到最终的识别结果。 -全局限制 H1:相同Frame表达相同的Event H2:相关Frame表达相同的Event H2是H1的扩展,这里相关Frame定义为具有Inheritance、 See_also和Perspective_on关系的Frame。 上面两条限制过于严格,FrameNet中,有很多Frame不能对应到唯 一的事件类型上,例如Dead_or_alive, 只有部分句子表达了Dead事 件。为了弥补这一问题,引入第三个限制。

方法 PSL Model -全局限制 H3: 相同LU表达相同的Event Dead_or_alive的LU为:alive.a, dead.a, deceased.a, lifeless.a, living.n, undead.a, undead.n。其中标红的LU表达了 Dead事件。 另一方面,H1,H2也可以帮助H3纠正一些错误,例如对于 Clothing下的LU“Suit.n”, Basic ED模型会将其下的所有句子识别 为Sue事件,这是因为“Suit”是个多义词。然而,如果考虑H1, 那么这一错误将被纠正,因为Clothing下的其它LU并非多义词。

方法 PSL Model -建模

实验 数据 ACE2005, 529篇做训练集,30篇做开发集,40篇做测试集 FrameNet1.5, 共收集15万多个标注例句用于事件识别

实验 Basic ED Model 参数设置:200维词向量,300个隐藏层节点,batch size为100。

实验 在FrameNet中识别事件 -Baselines: ANN: 在原始ACE语料上训练得到的事件识别模型; SF (SameFrame): 在ANN的基础上,加入H1的限制; RF(RelatedFrame):在ANN的基础上,加入H2的限制; SL (SameLU):在ANN的基础上,加入H3的限制

实验 在FrameNet中识别事件 -人工评价:每个系统产生的结果随机抽样200个,人工标注

实验 在FrameNet中识别事件 -自动评价:将每个系统识别的事件加入ACE,扩展数据,自动评价

实验 利用FrameNet提高事件识别效果

未来的工作 未来工作: 将这一工作扩展到完整的事件抽取任务上 (包括事件参与者及其角 色的识别)。 ACE定义的事件粒度过粗,例如,街头斗殴和战争都被表示为同一 种事件Attack。我们计划用FrameNet中粒度更细的Frame对ACE 的事件框架进行优化,例如Attack可以被分为恐怖袭击、入侵等。

Thank You