短语结构制导的 范畴表达式演算 白 硕 赵章界 中国科学院计算技术研究所 2004年7月.

Slides:



Advertisements
Similar presentations
模板的使用 教育学 江西教育学院教育系 冯芳 2012 - 10. 第二章 教育学的产生和发展 第一节 教育学的研究对象和任务 第二节 教育学的产生与发展 第三节 学习教育学的意义与方法.
Advertisements

质数和合数 2 的因数( ) 6 的因数( ) 10 的因数 ( ) 12 的因数 ( ) 14 的因数 ( ) 11 的因数 ( ) 4 的因数( ) 9 的因数( ) 8 的因数( ) 7 的因数( ) 1 、 2 、 3 、 4 、 6 、 12 1 、 11 1 、 2 、 5 、 10.
颐高集团项目中心 海亮地产开发模式研究报告. 目 录 目 录 第四部分:海亮地产高周转模式执行 第二部分:海亮地产高周转模式原因 第三部分:海亮地产高周转模式内涵 第一部分:海亮地产企业背景 第五部分:海亮地产高周转支撑体系.
青少年儿童常见伤害的预防. 伤害的定义 伤害是指各种物理性、化学性或生物性 事件而导致人体发生暂时或永久性损 伤、死亡和残疾的一类疾病的总称。
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
用 藥 安 全 用 藥 安 全 護 理 師 張 嘉 芬. 前 言 前 言 正確用藥的方法 藥袋上的秘辛 為了減少重大疾病或是醫療處理、 用藥不當的相關事件發生。
阿尔伯特亲王 阿尔伯特亲王纪念碑 维多利亚女王夫妇 维多利亚女王一家 建造水晶宫 水晶宫初建时的照片.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
梦想启航 ——大学生活与职业规划专题讲座.
河北保定外国语学校 高三家长会.
环科系12级毕业实习动员会 -平安、感恩、责任
以信息化带动教育现代化,打造教育的“南山质量”
个体税收征管政策讲解 浏阳市地方税务局.
系统简介 理财顾问 业务 是基于通信平台的技术优势,整合《理财周刊》、第一理财网、乾隆集团等合作伙伴提供的理财产品内容和权威的理财专家资源,以集中式呼叫中心为主的服务方式,让普通百姓可以享受到快捷、全面、专业、权威的资讯及投资理财的服务平台。
证券投资技术分析.
同学们好! 希望这节课能带给你: 更 多 的 欢 乐! 更 多 的 收 获!
10.2 立方根.
分式的乘除.
職業災害調查及善後處理.
宦官那些事儿 宦官那些事儿 主讲:小学部李永善 主讲:小学部李永善.
电视教育课 【5】 小学生行为习惯养成教育.
宁波爱地房产市场年报 郊五区
不确定度的传递与合成 间接测量结果不确定度的评估
全国计算机等级考试 二级基础知识 第二章 程序设计基础.
程序、模型与表达 前端工程师的程序设计思考.
在PHP和MYSQL中实现完美的中文显示
程序的形式验证 - 简介 中国科学院软件研究所 张文辉 1.
12英语2班:王晓珏 仇丹妮 潘冬菊 袁承敏 吴爱婷 尹苗苗
ACD/ChemSketch软件在有机化学教学中的简单应用
自然科教學觀摩 教 學 者:黃藍萩 教學班級:3年9班 教學日期:
《编译原理与技术》 期末复习 计算机科学与技术学院 郑启龙 李 诚 25/12/2018.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
吃西瓜.
解决变化问题的自底向上 流程建模方法 严志民 徐玮.
Experiment 2: 讲评 数据库系统概论实验课二.
C语言程序设计 主讲教师:陆幼利.
EBNF与操作语义 请用扩展的 BNF 描述 javascript语言里语句的结构;并用操作语义的方法描述对应的语义规则
Partial Differential Equations §2 Separation of variables
过程自发变化的判据 能否用下列判据来判断? DU≤0 或 DH≤0 DS≥0.
$9 泛型基础.
超越自然还是带来毁灭 “人造生命”令全世界不安
用计算器开方.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
把字句与被字句的变换规则 詹卫东.
第4章 Excel电子表格制作软件 4.4 函数(一).
北师大版五年级数学下册 分数乘法(一).
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
國民年金 np97006.
数据集的抽取式摘要 程龚, 徐丹云.
Chapter 18 使用GRASP的对象设计示例.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
1.非线性规划模型 2.非线性规划的Matlab形式
北师大版 五年级上册 第五单元 分数的意义 拓展 问题 探究 练习.
分数再认识三 真假带分数的练习课.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
形式语言学的战国时期 与 支配及约束理论.
基于列存储的RDF数据管理 朱敏
Adj + Noun映射到知识库中的classes
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
第十七讲 密码执行(1).
大家來看日全食.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
第三章 图形的平移与旋转.
Presentation transcript:

短语结构制导的 范畴表达式演算 白 硕 赵章界 中国科学院计算技术研究所 2004年7月

有一种东西叫意义? 符号,最根本的属性是“牺牲自己、代表别人” 语义学,顾名思义,研究的是符号的意义,也就是被符号代表的那个“别人”,即它的“所指” 如果符号和它的意义完全同构,研究符号本身就足够了,可惜即使在数学中,这一点都做不到 在自然语言中,不确定的指称、不确定的角色指派、失败的举一反三,让我们寄希望于意义

不确定的指称 鸡 停止了进食 鸡 不吃了 不吃 鸡 这种食物了 符号的世界 意义的世界

不确定的角色指派 张三 李四 坦白交待 找 去 张三 李四 坦白交待 找 去 张三 李四 坦白交待 找 去

不成功的举一反三 看了三天就腻了 开始看 腻了 看了三天就忘了 看完了 忘了

计算机处理语言一定需要意义? 计算机处理自然语言,面对着各个层次上的不确定性 之所以需要意义和(传统意义上的)语义学,正是由于这些不确定性 直接在这些不确定性的驱动下设计具有恰当区分能力的标签(标注)体系,在这一过程中不排除借鉴意义的世界中的若干要素,可能是一种更有效的做法

“权宜的”语义学 我无需关心意义的世界到底有什么 我无需努力去“重构”意义的世界,为它建立什么模型 我只需为大大小小的符号串贴一些“人为的”、“权宜的”标签,在这种标签之间定义一种演算,做到: 我们在意义的世界里感受到多少种不确定的指称,这种演算一定会给出多少套不同的标签 我们在意义的世界里感受到多少种不确定的角色指派,这种演算一定会在标签之间建立多少种结构制约关系 那么,从计算的角度看,这种演算就可能是成功的

这种标签演算体系应该—— 有层次(反映标签之间的上下位关系) 有结构(反映成分间基于标签的结合关系) 有运算(构造正确的标签组合) 有约束(构造时满足并传播特定约束条件) 有弹性(利用结构中满足特定条件的标签) 有顺序(利用标签在结构中的顺序信息)

范畴表达式演算正中下怀 有层次(偏序) 有结构(带空穴的复杂标签) 有运算(特化、泛化、约分) 有约束(填入空穴时的匹配约束,空穴与其他标签的绑定约束,句法规则对填入空穴的方式的约束) 有弹性(可以指定与标签匹配的空穴) 有顺序(可以指定与标签匹配的左数/右数第几个空穴)

有层次——基本范畴的继承关系 …… top entity relation obj mental event boolean animate food 基本范畴集合和它上面的偏序关系构成一非空的、可数的、有界完备的偏序集合 …… human

有结构——复杂范畴 如果a,b1,b2,…,bn是范畴,那么a/ b1,b2,…,bn也是范畴,其中a称为中心范畴, b1,b2,…,bn称为空穴 如果一个复杂范畴的空穴被相应范畴或其特化范畴所填充,那么这个复杂范畴就变成它的中心范畴 a b1 b2 bn 空穴

有运算——特化与泛化 在基本标签集合中,下位标签与上位标签可进行特化(⊙ )运算,结果为下位标签。例如: Entity ⊙ human = human 在基本标签集合中,任何两标签可进行泛化(∨ )运算,结果为二者的最小公共上位标签,也就是说,基本标签集合和它上面的泛化运算构成一半格。例如: Human ∨ food = obj

有运算——约分 * * 类比:物理学中的“量纲” animate Event / animate, food food animate

有约束——继承、绑定、规则 引入了偏序结构上的约分机制,扩充了约分对象 取消了范畴语法中机械依赖语序的左右除法和左右约分 引入了范畴之间的绑定关系,借鉴中心词的继承,扩充了约分效果的影响范围 引入了短语结构制导机制,利用短语结构规则对范畴的限定关系,缩小了候选约分运算的范围

绑定约分 * * 绑定约分利用下标,解决约分过程中范畴之间的同步关系 红[obj/obj] 太阳[astro] 背景:中心词从分母向分子传播,以及长距离相关 剩下的是obj,不是astro! 都变成astro 红[obj<1>/obj] * 太阳[astro<1>] 增加了下标以后,所有下标相同的范畴表达式要同步地刷新特化结果

短语结构制导的约束规则 * * 谁跟谁约分? 句法层的强制约束,可以传导到范畴表达式演算中来,缩小演算中的不确定范围 好[entity/entity] * 爸爸[human/human] *一个好人的爸爸 好[entity/entity] * 爸爸[human/human] 一个人的爸爸是好的 NP[entity<1>] *AP[entity<1>/entity] NP[entity<1>/C()]

“爸爸妈妈”这个短语结构的范畴表达式,既不负载在“爸爸”上面,也不负载在“妈妈”上面,而是负载在整个短语结构上面 空成分负载结构的情况 联合结构 “爸爸妈妈”这个短语结构的范畴表达式,既不负载在“爸爸”上面,也不负载在“妈妈”上面,而是负载在整个短语结构上面 NP[entity]NP[entity] null[entity/entity,entity] NP[entity] 爸爸[human/human] 妈妈[human/human]

述补结构的范畴表达式,既不负载在述语上面,也不负载在补语上面,而是负载在整个短语结构上面 空成分负载结构的情况 述补结构 述补结构的范畴表达式,既不负载在述语上面,也不负载在补语上面,而是负载在整个短语结构上面 V[Event/C(entity)] A[Boolean/entity] VP[Boolean/C()]V[Event/C(Entity)] Null[(Boolean<1>/C(Entity<2>) /(Event/C(Entity<2>)), Boolean<1>/Entity<2>] A[Boolean/Entity]

有弹性,有顺序——定位因子 从范畴表达式的抽象“分母”上提取特定类型的空穴进行约分运算 了:(boolean/C())/(relation /C()) (只表示抽象分母) 把:(Event/C())/Entity, Event/C<1#>(Entity) (从抽象分母中提取右数第一个Entity范畴) 被:(Event/C())/Entity, Event/C<#1>(Entity) (从抽象分母中提取左数第一个Entity范畴)

理论渊源 范畴语法 配价理论 类型-逻辑语义学 依存语法

短语结构如何制导 主谓结构 述宾结构 述补结构 联合结构 偏正结构(定中) 偏正结构(状中) 介宾结构 连谓结构(连动) 连谓结构(兼语) 双宾结构 的字结构 把字结构 被字结构 给字结构 在字结构 所字结构 时态结构 数量结构……

王冕死了父亲 王冕死了父亲{S}[/boolean] 主谓 死了父亲{VP}[/boolean/human] 述宾 死了{VP}[/boolean/animate] 时态 死{V}[event/animate] 父亲{NP}[human/human] 王冕{NP}[human] 了{了}[boolean/relation]

坐着{VP}[boolean/animate] 台上坐着主席团 台上坐着主席团{S}[boolean] 主谓 Null[boolean/place,boolean] 坐着主席团{VP}[boolean] 述宾 坐着{VP}[boolean/animate] 时态 坐{V}[event/animate] 主席团{NP}[human] 台上{NP}[place] 着{着}[boolean/relation]

卖盐的 卖盐的{S}[human/human] 的字 卖盐{VP}[event/human,human] 述宾 卖{V}[event/human, human,obj] 盐{N}[obj] 的{的}[entity<1>/(relation/C<#1>(entity<1>))]

我是县长派来的 我是县长派来的{S}[boolean] 主谓 是县长派来的{VP}[boolean/entity] 述宾 是{V}[boolean/entity, entity] 县长派来的{NP}[ human]) 的字 的{的} entity<1>/(relation/C<#1>(entity<1>)) 县长派来{VP}[event/human<1>] 主谓 派来{VP}[event/human, human<1>] 述补 派{V}[(event/C())/human, human<1>, relation/C(human<1>)] 我{NP}[Human] 县长{NP}[human] 来{V}[event/mobile]

这些馒头把我吃胖了 这些馒头把我吃胖了{VP}[boolean] 主谓 把我吃胖了{VP}[boolean/food] 状中 把我{PP}[(relation<1>/C())/relation<1>/C<1#>(Human)] 介宾 把:(relation<1>/C())/Entity<2>, relation<1>/C<1#>(Entity<2>) 我{N}[human] 吃胖了{VP}[boolean/animate, food] 时态 吃胖{VP}[boolean/animate, food] 了{了}[boolean/relation] 述宾 这些馒头{NP}[food] 吃{V}[event/animate, food] 胖{A}[boolean/animate]

他被地主放狗咬了 被地主放狗咬了:event 主谓 他{NP}[human] 被地主放狗咬了:event/entity 状中 被地主:(relation/C())/human<1>, relation/C<#1>(human<1>) 介宾 被:(relation/C())/Entity, relation/C<#1>(Entity) 地主{NP}[human] 放狗咬了{VP}[(event/entity)/human] 兼语 放{V}[(event/C())/human, animate<1>, relation/C(animate<1>)] 狗{NP}[animate] 咬了{VP}[boolean/animate, entity] 时态 咬{V}[event/animate, entity] 了{了}[boolean/relation]

语义指向——树砍光了 树砍光了{S}[boolean/human, tool] 树{NP}[plant] 砍光了{VP}[boolean/human,obj,tool] 砍光{VP}[boolean/human,obj,tool] 了{了}[boolean/relation] 砍{V}[event/Human,obj, tool] 光{A}[boolean/entity] Null[(Boolean<1>/C(Entity<2>) /(Event/C(Entity<2>)), Boolean<1>/Entity<2>]

语义指向——他砍累了 他砍累了{S}[boolean/obj, tool] 他{NP}[human] 砍累了{VP}[boolean/human,obj,tool] 砍累{VP}[boolean/human,obj,tool] 了{了}[boolean/relation] 砍{V}[event/Human,obj, tool] 累{A}[boolean/animate] Null[(Boolean<1>/C(Entity<2>) /(Event/C(Entity<2>)), Boolean<1>/Entity<2>]

语义指向——刀砍钝了 他砍累了{S}[boolean/human,obj,] 刀{NP}[tool] 砍钝了{VP}[boolean/human,obj,tool] 砍钝{VP}[boolean/human,obj,tool] 了{了}[boolean/relation] 砍{V}[event/Human,obj, tool] 钝{A}[boolean/tool] Null[(Boolean<1>/C(Entity<2>) /(Event/C(Entity<2>)), Boolean<1>/Entity<2>]

泛化运算的消岐作用 张三和李四的书包{NP}[stationary] 张三和李四的书包{NP}[obj] 张三和李四{NP}[human] 的{的}[entity/entity] 书包{NP}[stationary] 和 {和}[entity<1> ∨ entity<2>/entity<1>,entity<2>] 张三{NP}[human] 李四{NP}[human]

总结 我们提出了一套标签演算体系 它继承了范畴语法、配价理论、类型-逻辑语义学、依存语法的优点 它可以在传统的表层语法框架内,更好地捕捉成分之间相互作用,从不确定的指称、不确定的角色指派中最终筛选出接近直观的结果 它有明确的、可检验的计算机制

Thanks. Any question? 请发邮件至 bai@ncic.ac.cn 与我联系