Semantic Decomposition for Question Answering

Slides:



Advertisements
Similar presentations
讀經教育  第一組:吳碧霞、陳鍾仁  第二組:吳雪華、謝濰萁  第三組:邱國峰、林佳玫. 不論上智下愚 成功的教育 讓每個孩子 都能成為最優秀的人才.
Advertisements

护理部教学管理 南医大二附院 张淑芬. 护理部主要工作:  培训  质量  教学科研 临床教学的秘诀 What – 需要的、喜欢的 Who – 教师的角色 – 学生的程度、学习方式 How – 教学方法.
仪 容. 一、化妆的技巧 眼部的化妆 唇部化妆 眉部化妆 鼻部化妆 根据脸型化妆 根据脸型选发型.
新闻写作基础知识 一. 新闻导语 二.新闻主体 三.新闻结构 四.角度选择.
人力资源管理师辅导讲座 ——案例分析及解题要点
第一部分 考试总体分析 第二部分 命题思路与答题方法 技巧分析
企业培训师培训(上) 王 囤 副教授.
外贸公社海关数据系统介绍 ——中国外贸营销新思路-主动出击.
2014 年上学期 湖南长郡卫星远程学校 制作 13 Getting news from the Internet.
使用說明 高年級 破解賽恩思 (Science)密碼 編輯群 明湖國小 吳立明 老師 李惠雯 老師 林宜璇 老師.
Time Objectives By the end of this chapter, you will be able to
第六章 顾客购买行为分析 学习目标 了解顾客购买行为分析的模式 理解消费者购买行为的特征和类型 掌握影响消费者购买行为的因素
防災教育管理與資源整合 主講者:康麗娟.
教育概論 幼一甲 第四小組 1.林瑞敏 2.許曉文 20.張舒婷 21.陳香如.
加油添醋話擴寫 日新國小 鄒彩完.
【家庭生活記趣 】 ▲幫忙製作相關標題 有▲記號,請美編設計找圖案.
聰明小紅帽~ 自我身體保護 救國團新竹張老師 李 清 垣.
十二年國民基本教育 高雄區入學方式說明 報告人:中山工商 楊薇主任.
數學解題王 ~從閱讀策略談起 分享者:吳祥銘老師.
应如何将神的话语大声读出来会众才能真正的听见!
案例研究报告撰写.
資2-6-3 能發現並討論問題 教育部增置國小圖書教師輔導與教育訓練計畫 圖書資訊利用教育教學綱要及教學設計小組
101學年度大學校院協助高中高職優質精進計畫/子計畫「產學創業企劃實務」
1、什么是工具?你能给“工具”下个定义吗? 2、您在工作、学习中都使用哪些工具? 3、您知道(或使用)的第一本工具书是什么?
讀 報 活 動 報紙版面知多少.
報告即將開始.
社團企劃書撰寫暨實際演練 巫正淵 (商務科技管理系秘書).
新闻写作刍议.
3. 一般問題 部份資料來源: YAHOO網 及本校08年升中學生提供
湖南农业大学 通讯的采写.
初中进阶 (2346 期 ) 1 版. 1. What types of bullying do you know about? Physical hitting, tripping, stealing and hair pulling Social telling other kids.
离职流程精细化标准推进材料 人事行政处.
How can we be a member of the Society? You should finish the following tasks if you want to be a member of the Birdwatching Society.
沿途风光讲解 全国职业教育数字化资源共建共享 旅游服务与管理 W-1.
Welcome Welcome to my class Welcome to my class!.
Life relies on sports 生命在于运动.
I always like birthday parties.
全球經濟與地理變遷 王文誠 Wen-Cheng Wang, PhD 國立臺灣師範大學 地理學系
新聞報導 一、什麼是新聞? 1、狗咬人不是新聞,人咬狗才是新聞 2、大眾關切的事 3、讀者有興趣知道的事 4、接近性.
学练优英语教学课件 八年级(上) it! for Go
HOW TO ACE -- THE IELTS SPEAKING TEST
加油添醋話擴寫 鄒彩完.
Time Objectives By the end of this chapter, you will be able to
Dì二十課 看bìng Dì二十课 看bìng
Unit title: 假期 – Holiday
Time Objectives By the end of this chapter, you will be able to
陕西省教育科学研究所 张雪莲 初中英语教学与2011年中考命题趋势思考 陕西省教育科学研究所 张雪莲
Unit title: 假期 – Holiday
十七課 選課(xuǎn kè) 十七课 选课(xuǎn kè)
第十五课:在医院看病.
Unit title: 假期 – Holiday
Single’s Day.
中国企业如何走进欧洲市场 “一次从欧洲商业角度的探讨”
Answering aggregation question over knowledge base
Unit title: 学校 School Area of interaction focus Significant concepts
BORROWING SUBTRACTION WITHIN 20
中央社新聞— <LTTC:台灣學生英語聽說提升 讀寫相對下降>
引導教學實務工作的知識根基 從三個面向來思考: 1.教學中的基礎知識是指什麼? 哪些領域的知識最為關鍵? 2.教師如何實踐及運用這些知識?
成才之路 · 英语 人教版 · 必修1 路漫漫其修远兮 吾将上下而求索.
107學年度高雄區 實用技能學程輔導分發 五福國中說明會
102-2金融法規(2~4) ~03..
美國亞利桑納州Eurofresh農場的晨曦
南投縣106年度 結合家長會防制學生藥物濫用宣導
M; Well, let me check again with Jane
九月十七日 Do now-写中文 Who Name also is/are/am friend.
國立東華大學課程設計與潛能開發學系張德勝
构件图和部署图.
活動主題:能「合」才能「作」 指導教授:張景媛教授 設 計 者:協和國小團隊 李張鑫 × 陳志豪.
第一节 计划的概念及其性质 第二节 计划的类型 第三节 计划编制过程
Area of interaction focus
Presentation transcript:

Semantic Decomposition for Question Answering 于佳婕 大家好,我今天报告的论文是关于问题的语义分解的,这篇论文发表在2008年ECAI会议上。

Introduction Decomposable questions & Atomic questions Decomposition form:sequences of two questions, later questions are built on top of the answers to earlier questions. 6 decomposition classes, linked to different decomposition methods. Decomposition methods are mostly based on the semantic representation of questions(MultiNet formalism ) 先简单介绍一下它的研究背景。这项研究是基于德语的问答系统来进行的。 首先,它认为问答系统所遇到的问题分为可分解的问题和原子性的问题。这里可分解的问句并不是特指含有多个分句的问句,而是指通过分解,更容易回答正确的问句。而对于可分解的问题(decomposable questions)来说,把它分解为一些简单问题,会更容易得到解答。这里提出的拆分方式是通过把一个问题拆分成两个更简单的问题,把对原始问题的求解实际上就转化成了对问题序列的求解,并且后一个问题是基于前一个问题的答案形成的。 对于可分解的问题,它目前提出了6个类别,不同的类别对应的也是不同的分解方法。这些分解方法中,大部分都是基于问句的语义表示来进行分解的,遵循的是MultiNet的表示形式。在语义层面分解的好处是,不需要做自然语言生成的工作,也不需要在重新生成的问句上进行parsing,从而规避了这两个过程中的错误。但这种方法的先决条件是,需要一个能够对问句提供充分语义表示的parser。

Decomposition Classes Temporal decomposition Local decomposition Coordinated situation decomposition Meronymy decomposition Description decomposition Operational decomposition 这里是它提出的6类可分解的内容,主要是含有时间限定的问题、含有地点限定的问题、含有相同的情境限定的问题、含有部分-整体关系的问题、含有描述限定的问题和计算型问题。 它通过一个约1200条问句的德语数据集统计了这些问题的出现频次,总体来说,大约有1/6的问题是可分解的。因为这些问题的频次都不高,所以他没有尝试基于规则去做拆分,而是通过MultiNet提供的API进行的。 论文里也没有详细讲拆分的方法和求解的策略,而是主要讲了他对于可分解问题的分类设计。 下面用一些例子,说明一下这6类分解。

Temporal Decomposition A situation that is used as a temporal specification can be replaced by its date of occurrence. E.g. Who was US president when Vietnam war ended? 首先是时间相关内容的分解,它的作用就是把问句里的时间状语转换为对应的日期。 这里的一个例子是问:在越南战争结束时,美国总统是谁? 对于第一幅图中原问句的时间状语部分,通过加入一个问句焦点的结点,转换成了第三幅图上半部分的次级问句:越南战争是什么时候结束的,并把得到的答案接入到原有的图中,从而得到了第二幅图的简化问句:在1975年4月,美国总统是谁? 这里的每条边表示一种关系,每个结点表示一个概念,下标表示它所属的实体种类,方括号里描述了它的一些属性。含有?的结点标志的是问题的焦点,并且?后面的内容表示句子的类型。图里面有一些边折叠在结点的下面。 对于概念,co=具体事物concrete objects,d=离散对象discrete objects,st=状态state,dn=发生happenings,ad=动态情境的抽象abstraction from dynamic situations,nu=数值化的量numeric quantificators,t=时间相关的描述temporal description of situations,me=度量单位units of measurements,oa=操作属性operational attributes,ta=抽象的时间对象abstract temporal objects 对于属性,gener表征泛化程度(sp特指,ge泛指),fact表事实程度(real真实,nonreal非真实的,hypo假设的),quant表量化(one一个,nfquant表示all),refer表确定是否引用(det表示引用了实例,indet表示无引用),varia表变化程度(var变量,con常量),card表基数,etype表外延性(0表非集合,1表0的集合……) 对于边,ARG表参数详情,ASSOC表联系,ATTR表属性详情,EQU表等价,SUB表示对象实例,SUBS表情境实例,SUBR表元级实例,TEMP表示对情境的时间限制,VAL表示属性与值的关系 Who was US president when Vietnam war ended? Wer war US-Pra ̈sident, als der Vietnamkrieg endete? Who was US president in April 1975? Wer war US-Pra ̈sident im April 1975? When did the Vietnam war end? Wann endete der Vietnamkrieg? Answer:April 1975

Local Decomposition a local (or spatial) restriction can be replaced by the answer(s) to a subquestion about the exact location(s) fulfilling the restriction. E.g. Which parties reign in countries that are in Northern Europe? =》(subquestion)Which countries are located in Northern Europe? =》(revised question with a list-valued answer)Which parties reign in Sweden, Norway, and Finland? 问句中的地点或者说空间限制,与时间限制一样,可以进行分解。 例如,问:哪些政党统治北欧的国家?首先查询:“哪些国家在北欧地区”得到了一个答案序列,再对这些答案序列中的值提问“哪些政党统治瑞典、挪威和芬兰”

Coordinated Situation Decomposition A question can contain several propositions also in the form of a con- junction of situations, often involving ellipsis. E.g. Which football players played for Borussia Dortmund and Real Madrid? =》(subquestion)Which football players played for Borussia Dortmund? =》(revised question with a list-valued answer)Do …… played for Real Madrid? 有一些问题,其实通过省略部分成分的方式,包含了几个并列的命题。对于这种问题,我们通过拆分并列命题,也能够让它们更容易被解答。 比如,问“哪个足球运动员为多特蒙德和皇家马德里踢过比赛?”,通过先查询“谁为多特蒙德踢过比赛”得到一个人名列表,再询问列表中的每个人是否为皇马踢过球,就可以得到答案。

Multisituation Decomposition Involve 2 situations that are linked by a relation in the semantic network for the question. Includes: Temporal Decomposition Local Decomposition Coordinated situation Decomposition 对于前面讲过的这三类分解,其实都可以归入“多情境分解”的大类,因为在这些问句的语义表示中,都出现了两个以某种关系相连的情境。这也就可以作为这些分解类型的一种表现,用于提取一些特征来帮助识别。

Meronymy Decomposition Meronymy decomposition tries to generate and exploit geographical knowledge on the fly (here: meronymy knowledge for geographical objects). E.g. When did a hurricane hit Northern Germany? =》 (subquestion) Which regions/cities are in Northern Germany? =》(revised question with a list-valued answer)When did a hurricane hit Niedersachsen/Hamburg……? 部分整体关系的分解,主要是应用在地理知识领域,用于处理问句中某些精确地点与抽象地域之间的转换。 比如这里的德国北部,通过查询得到德国北部的地区或城市,就把一个不一定能获取到相应知识的表示,转化为更容易获取到对应知识的表示方式。 而这一类与前面所说的地点的分解不同的是,地点的分解要求地点被一个从句所修饰,而不是这里“Northern Germany”这样的命名实体。也就是说,前者是针对一种地点状语从句的修饰关系来触发分解的,而这里是针对地点相关命名实体来触发的。

Description Decomposition Descriptions in question focus E.g. Which Italian cities have an Olympic stadium? =》 (subquestion) Name Italian cities =》(revised question with a list-valued answer)Does Rome/Pisa…… have an Olympic stadium? 对于问句焦点中的描述性限定,也可以把它分解成一个子问句。 比如这里问“哪个意大利城市拥有一个奥林匹克体育场”,这里意大利是对城市的一个描述性限定,就可以把它分解成一个“列举意大利城市”的子问题,再根据子问题的结果回答原始的问题。

Operational Decomposition Calculate an operation on the different answers of a subquestion E.g. How many countries belonged to the EU in 1994? =》(subquestion)Name countries that belonged to the EU in 1994 =》 (revised question with a list-valued answer)count the countries in the answer of the subquestion Sometimes can be answered directly( The 12 EU member states…… ) Operations:cardinality, maximum, minimum, mean average…… 最后一类是运算相关的分解,这一类问题需要我们对子问题的答案进行一些运算操作。 典型的例子有问“1994年有多少国家属于欧盟”,可以分解出“列举1994年属于欧盟的国家”这样的子问题,再对它的答案进行计数操作。 这里需要说明的是,因为文本知识可能有很多种表达形式,这种问题有时候可以不做拆分直接回答,比如如果文本中提到“12个欧盟成员国”这样的短语,就不需要再进行计数操作。所以这里提出的问题拆分都是在原始问句得不到解答的时候才会进行。 而运算相关的拆分实际上也比较复杂,可能存在像基数、最大值、最小值、平均值这样的运算要求。为了避免分解出错误的子问题,还需要采用一些启发式的方法。比如对于一个计数问题,如果存在很多个列举的答案,那么就需要关注问句中是否含有“thousand”、“million”这样的基数。s

Evaluation 在他的实验中,对于问题分类的结果展示在第一个表格中。他其实只是对于问题是可分解的还是原子性的做了二分类,而不是对问题属于哪个分解类别做了多分类的实验。从这个结果来看,可能因为任务的难度比较大,可分解性问题的识别精度和召回率都不算太高,但因为它们占比比较小,所以整体的识别精度还不错。 第二个表格展示的是进行问题分解前后做对的题数。总体而言,通过分解,在184个可分解的问句中,做对的题从25道提升到43道。并且,虽然由于分类错误,对一些原子性的问句也做了拆分,但没有影响到原子性问句的答对数量。

Some additional remarks Sometimes decomposing questions can be dangerous E.g. Multi-property Decomposition:a concept is modified by two or more properties. “Name a German communist politician. ” A question can belong to zero or more decomposition classes E.g. How many aristocrats were archbishops in Italy before the Western Schism? operational (How many), description (aristocrats), meronymy (in Italy), temporal (before the Western Schism). A question can often be decomposed in several ways when it contains several propositions Which planet orbits the sun once in every 12 years? A:a) What orbits the sun once in every 12 years? b) Is ⟨subanswer⟩ a planet B:a) Name planets! b) Does ⟨subanswer⟩ orbit the sun once in every 12 years? 这里是对问题拆分的一些补充说明。 对于问题分解来说,需要考虑到分解操作的可能带来的风险,控制风险的方法。例如,被多个属性修饰的某个概念,也可以把这些属性拆分开作为子问题。但这种情况有可能导致回答错误。例如对于“说出一个德国共产党派的政客”这样的问题,如果拆分成“列举德国政客”和“判断他是否是共产党派的政客”,在大量的文本中很容易找到一个人名“Miller”既是德国政客,又是共产党派的政客,但相同的人名却不是指向同一个人。 另外,有些问题可能有属于多个分解类别,但在这篇文章里,没有对这种问题进行层次的拆分,而是尝试把它归为一个更容易得到解答的类别中。而什么类别更容易得到解答,哪些内容需要分解,也是跟文本信息的性质有关的。例如,如果文本是关于德国的新闻语料的,那么一个询问德国有多少城市的问题更偏向归于计数分解,而询问美国有多少州的问题就不会归入计数分解。这种偏向也主要体现在对于问题的标注上,通过标注影响模型的分类偏好。 而就算是对一个确定了分解类别的问题而言,由于存在多个命题,它的分解方式也可能存在多种。而不同的分解方式对回答正确性的影响也是不一样的。怎么选择内层和外层的问题,也是需要进一步探讨的问题。而最对于系统来说,可以通过尝试多种分解方式来选择回答。这篇文章里的系统,更偏向于选择子问题答案更少的回答。

A decomposition task Which class does the question belong to Where to split How to adjust question type How to integrate the subanswer(s) into the original question to form the revised question(s) 所以,从这篇文章的工作来看,对于一个问题分解的任务,需要考虑的问题主要就是需要对问题做哪一类分解,从哪里拆分,怎么调整拆分后问题的类型,以及怎么把子问题的答案整合到原始问题中,形成一个简化的问题。这些内容都还需要一些更深入的研究。