欢迎使用本课件 教材简介: 名 称:人工智能原理与应用 作 者:张仰森 出版社:高等教育出版社 章 节:共十章 主讲教师: 宗春梅.

Slides:



Advertisements
Similar presentations
1 天天 5 蔬果 國立彰化特殊教育學校 延杰股份有限公司營養師:陳婷貽. 2 蔬果彩虹 579 蔬果彩虹 歲以內兒童,每天 攝取五份新鮮蔬菜水 果,其中應有三份蔬 菜兩份水果 蔬菜份數水果份數總份數 兒童 325 女性 437 男性 549.
Advertisements

高等学校英语应用能力考试 考务培训 兰州文理学院教务处 2014 年 12 月. 考务培训 21 日请监考人员上午 8:00 (下午 2:30 )到综合楼 205 教室集合,查看 监考安排,由考务负责人进行考务 培训。
一、听力口语模拟考试情况 去年模拟总分
語言與文化通識報告 - 台日年菜差異 - 指導老師 : 葉蓁蓁 小組 : 日本微旅行 組員 :4a21b032 吳采玲 4a21b037 沈立揚 4a 洪雅芳 4a 陳楚貽 4a 王巧稜.
第八章 土地行政管理.
時間流程 科學班 藝才班 體育班 職業類科 會考 技優 直升 第一次免試入學 第二次免試入學 特色招生甄選入學 (3~4月報名及招生)
「互联网金融2.0时代」与房地产的融合 广州互联网金融协会会长、广州e贷总裁 方颂.
企业会计学(三) 人大版本 吕 昌.
第一章 人口与环境 第一节 人口增长模式.
第一冊第二課 師 說 韓愈.
小学科学中的化学 武威十九中 刘玉香.
神州五号、六号的发射和回收都取得了成功 ,圆了几代中国人的航天梦,让全中国人为之骄傲和自豪 神州五号、六号的发射和回收都取得了成功 ,圆了几代中国人的航天梦,让全中国人为之骄傲和自豪!但是你们知道我们的科学家是怎样迅速地找到返回舱着陆的位置的吗? 这全依赖于GPS——卫星全球定位系统”。大家一定觉得很神奇吧!学习了今天的内容,你就会明白其中的奥妙。
105年基北區高中職適性入學宣導 教育會考後相關作業說明
行政公文 纪 要 讲授人: 安学珍 铜仁职业技术学院.
據點考核與評鑑 報告人:臺南市政府 照顧服務管理中心.
二代健保補充保費 代扣項目說明 簡報.
第4课 “千古一帝”秦始皇.
特殊族群運動健康訓練(I).
依据教材 全国高等教育自学考试指定教材 《西方行政学说史》, 竺乾威主编,高等教育出版社。
正 信 讀 書 會 主 持 群 : 姚 永 錩 、 鄭 健 、 陳 淑 珍 佛法的生活應用 2008/07/23.
非法集资典型案例评析 南京师范大学法学院 蔡道通 2016年1月.
专题(二) 交往沟通 掌握技能 命 题 解 读 背 景 材 料 新 题 演 练 考 点 链 接 1.
企业所得税几项热点难点 业务问题讲析 湛江市地税局税政科 钟胜强.
房地产开发企业 土地增值税清算 (基础篇).
班級老師:潘盈仁 班級:休閒三甲 學號:4A0B0124 學生:柯又瑄
松竹梅岁寒三友 步入建交 桃李杏村暖一家 迈进职教 活出精彩.
腐败的食物表面有白色小圆斑点,绿色斑点等
眼睛过劳死.
第八单元第二课第一课时 严守法律 温州四中 蒋莉青.
教師專業發展評鑑(一) 實施計畫與規準討論
第 五 課 愛蓮說 1.課文導讀 2.作者介紹 3.課文 4.注釋 5.應用練習 6.習作.
高级财务会计.
默写基础知识: 1、家庭是由 关系、 关系或 关系而结合成的亲属生活组织。家里有 ,家中有 。
第四章 借贷记账法的应用.
第五章 主要经济业务核算 第一节 筹集资金的核算 第二节 供应过程的核算 第三节 生产过程的核算 第四节 销售过程的核算
什么是颈椎病? 颈椎病是指颈椎间盘退行性变,及其继发性椎间关节退行性变所致脊髓、神经、血管损害而表现的相应症状和体征。
第三章 生产费用的核算 第一节 材料费用的归集和分配 第二节 工资费用的归集和分配 第三节 辅助生产费用的归集和分配
试卷 20 14安徽 13全国卷 大纲卷 13山东卷 13浙江卷 2013上海卷 13海 南 卷 13江苏卷 题号 30 32
昆明心桥心理健康研究所 心理健康工作者 钱锡安 讲座预约 个案咨询预约
成本会计 主讲教师:钟小玲 讲师 硕士 主讲教师:钟小玲 讲师 硕士 办公电话: 手机:
第一单元 中国传统文化主流思想的演变.
公務人員退休法、撫卹法 法制與實務講習 銓敘部退撫司 中華民國99年8月.
荆门市农业水价综合改革 工作情况汇报 湖北省荆门市水务局 二0一六年九月.
上节主要内容回顾 借贷记账法的主要内容: 总分类账户与明细分类账户的平行登记 记账规则 试算平衡 要点:内容相同、方向一致、金额相等
《傅雷家书》 学 科:语文 年 级:九年级 授课教师:王宁宁.
高三地理专题复习 地方时和区时 解题技巧.
紧抓PPP项目为招标代理机构 带来的转型发展机遇
第一節 行政裁量與不確定法律概念 第二節 行政裁量
房产税纳税申报---全部自用 全部自用 问:该企业应纳多少房产税?每月应纳多少房产税? 案例1(全部自用)
邂逅“行程”——行程问题 四年级 数学 周凯.
105年基北區高中職適性入學宣導 教育會考後相關作業說明
本课设置5个环节 一、限时秒杀--5分钟 二、摩拳擦掌--9分钟 三、刀锋相见--20分钟 四、现炒现卖--5分钟 五、相约课后--1分钟.
从中国与联合国的关系演进 看联合国的产生与发展
全方位自主學習平台- 教師評鑑平台 操作說明
第2次课 上下文无关文法
第四单元:可能性 掷一掷 武汉市洪山区教育科学研究培训中心 李桂玲.
第三节 实对称矩阵的对角化 一、方阵对角化的条件 二、实对称矩阵的对角化 三、小结与思考 2019/4/6.
票據與生活.
海水运动→→洋流 你知道吗 在十年前,日本的科学家曾经做过一个有趣的实验:在日本以东的洋面拨撒了大量的带有颜色的物质。
成 本 会 计 学 第七章 产品成本计算的辅助方法.
在山的那边 ——作者: 张家新 —— 小时候,我常伏在窗口痴想 ——山那边是什么呢? 妈妈告诉我:海 哦,山那边是海吗?
小学5.
國民年金 np97006.
高雄半日遊 西子灣-旗津-駁二.
加減法文字題 國小低年級學生對加減法文字題的瞭解 小組成員 陳育娟 羅珠綾 侯宜孜
飛行器製作與飛行 講師:劉修建.
歡迎大家來到開心國小! 我們每個月舉辦一次慶生會, 所以現在要調查全班的生日。 1號: 9/19 9號: 3/17 2號: 9/5 10號: 5/12 3號: 1/8 11號: 7/25 4號:11/27 12號:10/4 5號: 8/31 13號: 9/5 6號:
6上 5 小數除法(二) 9.有A、B兩袋金幣,金幣的數量相同。 的金幣全部是真的,共重 。 中有一些金幣是假的,共重 。 A袋
因果性:一个形而上学的预设 赵敦华 2008年5月.
2.1 试验: 探究小车速度随时间变化的规律.
Presentation transcript:

欢迎使用本课件 教材简介: 名 称:人工智能原理与应用 作 者:张仰森 出版社:高等教育出版社 章 节:共十章 主讲教师: 宗春梅

在信息化社会中,语言信息处理的技术水平和每年所处理的信息总量已成为衡量一个国家现代化水平的重要标志之一。在这样的社会需求下,自然语言理解作为语言传息处理技术的一个高层次的重要方向,一直是人工智能界所关注的核心课题之一。显然,如果计算机能够理解自然语言,人机间的信息交流能够以人们所熟悉的本族语言来进行,那将是计算技术的一项重大突破。另一方面,由于创造和使用自然语言是人类高度智能的表现,因此对自然语言理解的研究也有助于揭开人类智能的奥秘,深化我们对语言能力和思维本质的认识。所以说,这个研究方向在应用方面和理论方面都有重大意义。

7.1 自然语言及其理解 7.1.1自然语言及其构成 1.什么是自然语言 7.1 自然语言及其理解 7.1.1自然语言及其构成 1.什么是自然语言 自然语言是指人类语言集团的本族语,如汉语、英语、日语等。自然语言是相对于人造语言而言的。人造语言是指世界语或计算机的各种程序设计语言。众所周知,语言是思维的载体,是人际交流的重要工具。在人类历史上以语言文字形式记载和流传的知识占到知识总量的80%以上。就计算机的应用而言,据统计用于数学计算的仅占10%,用于过程控制的不到5%,其余85%左右都是用于语言文字的信息处理。在信息化社会中,语言信息处理的技术水平和每年所处理的信息总量已成为衡量一个国家现代化水平的重要标志之一。

7.1 自然语言及其理解 7.1.1自然语言及其构成 2、自然语言的构成(如下图)

7.1 自然语言及其理解 7.1.2自然语言理解的概念 自然语言理解是指机器能够执行人类所期望的某些语言功能。这些功能包括: 7.1 自然语言及其理解 7.1.2自然语言理解的概念 自然语言理解是指机器能够执行人类所期望的某些语言功能。这些功能包括: 1.问答(quesVtioVn-aVnsweriVng):机器能正确地回答输入文本中的有关问题; 2.文摘生成(summariziVng):机器有能力产生输入文本的摘要; 3.释义(paraphrase):机器能用不同的词语和句型来复述其输入文本; 4.翻译(VtrahslaVtioVn):机器具有把一种语言(源语)翻译成为另一种语言(目标语)的能力。 7.1.3自然语言理解的进展 7.1.4自然语言过程的层次

7.2 词法分析

7.2 词法分析

7.3 句法分析 句法分析就是要对句子或短语的结构进行分析,以确定构成句子的各个词、短语等之间的相互关系以及各自在句子中的作用等,并将这些关系用层次结构加以表达。

7.3 句法分析 7.3.1 短语结构语法理论与乔姆斯基语法体系 1、短语结构语法理论 7.3 句法分析 7.3.1 短语结构语法理论与乔姆斯基语法体系 1、短语结构语法理论 一部短语结构语法G可以用如下的四元组来定义:     G=(Vt,Vn,P,S) 其中,Vt是终结符的集合,终结符是指被定义的那个语言的词(或符号);   Vn是非终结符的集合,这些符号不能出现在最终生成的句子中,是专门用来描述语法的。显然,Vt和Vn的并构成了符号集V,而且Vt和Vn不相交,因此有:     V=Vt∪Vn,     Vt∩Vn=φ (φ表示空集);   S是起始符,它是集合Vn中的一个成员;   P是一个产生式规则集。每条产生式具有如下的形式:     a→b   其中a∈V+,b∈V*,且a≠b;V*表示由V中的符号所构成的全部符号串(包括空符号串φ)的集合,V+表示V*中除φ之外的一切符号串的集合。

7.3 句法分析 7.3.1 短语结构语法理论与乔姆斯基语法体系 2、结束的短语结构语法理论---乔姆斯基语法体系 7.3 句法分析 7.3.1 短语结构语法理论与乔姆斯基语法体系 2、结束的短语结构语法理论---乔姆斯基语法体系 乔姆斯基(N.Chomsky)曾定义了以下四类语法: (1)无约束短语结构语法,如前所述,又叫做O型语法; (2)上下文有关语法(context-sensitive grammars),又叫做1型语法; (3)上下文无关语法(context-free grammars),又叫做2型语法; (4)正则语法(regular grammars),又叫做3型语法。

7.3 句法分析 7.3.1 短语结构语法理论与乔姆斯基语法体系 3、句法分析树 7.3 句法分析 7.3.1 短语结构语法理论与乔姆斯基语法体系 3、句法分析树 在对一个句子进行分析的过程中,如果把分析句子各成分间关系的推倒过程用树形表示出来的话,那么,这种图称做句法分析树。 如下图为语句 The girl writes letter with a pencil进行句法分析时建立的句法分析树。

7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 1、有限状态转移网络 7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 1、有限状态转移网络 扩充转移网络的概念来源于有限状态转移网络。我们曾指出,有限状态转移网络只能用来生成或识别正则(即3型)语言。   一个有限状态转移网络由一组状态(即结点)和一组弧(用来把一种状态连向另一种状态)所组成:   (1)其中的一个状态被指定为起始状态;   (2)在每条弧上都标注着该语法的终结符(包括词或词类)。 它表明必须在输入句子中找到这样一个词,才可以进行这条弧所规定的转移;   (3)状态集中有一个名为结束状态的子集。如果输入句子(或短语)的头从起始状态开始,经过一系列的转移,句尾恰好达到结束状态,我们就说这个句子(或短语)被这个转移网络所接受(或识别)。

7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 1、有限状态转移网络 7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 1、有限状态转移网络 右上图表示以冠词"the"开头的一类名词短语NP的转移网络,它可以拥有零个或多个形容词;最后以一个名词结尾。 假如输入的短语是:"the pretty picture"。从起始状态NP开始,它只有一条标注着"the"的外射弧,由于输入串中的第十个词能同它匹配;所以词"the"从输入串中被删除,过程则相应进入图中的,状态NP1。此时输入串是"pretty picture",由于第一个"pretty"的词类是ADJ,同标注ADJ的弧匹配,于是"pretty"从输入串中被删除,但沿着ADJ弧转移的结果是再次回到这个NP1状态.此时输入串只剩下最后一个词"picture",由于它是一个名词,因此发生了沿N弧前进到结束状态的转移。这时,输入串已成为空串,所以分析成功。

7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 2、递归转移网络 7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 2、递归转移网络 递归转移网络(recursive transition networks,简称RTN)是对有限状态转移网络的一种扩展,在RTN中每条弧的标注不仅可以是一个终结符(词或词类),而且可以是一个用来指明另一个网络名字的非终结符。   例如,下面是一部上下文无关语法:     S ∷=NP V NP PP*     NP∷=T ADJ* N PP*     PP∷=P NP 其中X*表示符号X可以出现零次或多次。这三条语法规则可以用下页图所示的递归转移网络来表示。

7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 2、递归转移网络 7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 2、递归转移网络 图中用来表示S,NP和:PP等三条上下文无关语法规则的递归转移网络

7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 3、扩充转移网络 7.3 句法分析 7.3.2 递归转移网络与扩充转移网络 3、扩充转移网络 ATN在以下三方面对RTN作了扩展和增强:   (1)添置了一组寄存器,用来存储分析过程中得到的中间结果(如局部句法树)和有关信息(如名词短语的人称和数。某些成分的语义特征等);   (2)每条弧上除了用句法范畴(如词类和短语标记)来标注以外,可以附加任意的测试,只有当弧上的这种溯试成功之后才能通过这条弧;   (3)每条弧上还可以附加某些动作,当通过一条弧时,相应的动作便被依次执行,这些动作主要用来设置或修改寄存器的内容。 设置哪些寄存器完全取决于句法分析的需要,并没有硬性的规定。 例如有关句型的信息:陈述句,疑问句,祈使句,可以存放在名为TYPE的寄存器中;动词信息及其局部结构可存放在名为V的寄存器中;当然也可设置象主语、谓语、宾语一类的寄存器来存储各种句子成分的信息以及它们的局部结构。所有这些寄存器都可以看作是程序设计中变量,它们从属于被设置的那个ATN子网络。对于ATN的后继弧来说,这些寄存器的内容可以被访问,并且根据附加在后继弧上的动作可以被复制、修改或组合。

7.3 句法分析 7.3.3 词汇功能语法 词汇功能语法(LFG)是由卡普兰和布鲁斯南(Bresnan)在1982年提出的,它是一种功能语法,但是更加强调词汇的作用。LFG用一种结构来表达特征、功能、词汇和成分的顺序。   LFG对句子的描述分为两部分:直接成分结构(Constituent Structure,简称C-Structure)和功能结构(Functional Structure,简称F-structure),C-structure是由上下文无关语法产生的表层分析结果。在此基础上经一系列代数变换产生F-structure。LFG采用两种规则:加入下标的上下文无关语法规则和词汇规则。

7.3 句法分析 7.3.3 词汇功能语法 2、词汇功能语法对句子的分析过程 用LFG语法对句子进行分析的过程如下: 7.3 句法分析 7.3.3 词汇功能语法 2、词汇功能语法对句子的分析过程   用LFG语法对句子进行分析的过程如下: 用上下文无关语法分析获得C-structure,不考虑语法中的下标;该C-structure就是一棵直接成分树; 将各个非叶节点定义为变量,根据词汇规则和语法规则中的下标,建立功能描述(一组方程式); (3) 对方程式作代数变换,求出各个变量,获得功能结构F-structure。

7.3 句法分析 7.3.4 自动句法分析算法 1、自顶向下回朔算法 2、自底向上并行算法 (具体内容请参照P257---P262)

7.4 语义分析 语义分析和句法分析是自然语言理解系统的两个最基本的功能模块。语义分析的任务是根据输入句子的句法结构和句中每个实词的词义推导出能反映这个句子意义(即句义)的某种形式化表示。一般来说,只有在获得输入语句可靠的语义表示之后,系统才能进一步完成问答、释义、翻译和文摘生成等任务。

7.4 语义分析 语义分析和句法分析是自然语言理解系统的两个最基本的功能模块。语义分析的任务是根据输入句子的句法结构和句中每个实词的词义推导出能反映这个句子意义(即句义)的某种形式化表示。一般来说,只有在获得输入语句可靠的语义表示之后,系统才能进一步完成问答、释义、翻译和文摘生成等任务。 1、逻辑形式表达及语义解析 2、义素分析法

7.5 大规模真实文本的处理 7.5.1语料库语言学的崛起 7.5.2语料库语言学的特点及研究对象 7.5.3汉语语料库加工的基本方法 7.5.4统计方法的应用及所面临的问题

7.6 基于语料库的自然语言建模方法 7.6.1基于概率分布的语言建模 7.6.2基于上下文信息的语言建模 7.6.3基于组合思想的语言建模 7.6.4语言建模相关问题 返回目录