语法分析本章内容语法分析器：把词法分析生成的词法单元流翻译成语法分析树（parse tree）

Slides:

Advertisements

Similar presentations

2014 年浙江省数量资料华图网校刘有珍数字推理年份题量数字规律三级等差 2. 和递推 3. 幂次修正 4. 倍数递推 5. 倍数递推 6. 特殊差级 7. 倍数递推 8. 倍数递推 9. 积递推 10. 分数数列

Advertisements

2016/9/41 12 年國教入學方案宣導資料. 2016/9/42 安全快樂健康發展活力多元創意發展適性揚才特色發展務實致用卓越發展學前教育國中小教育高級中等教育大專以上教育教育促進個人向上發展教育促進個人向上發展教育是國家最有利的投資教育是國家最有利的投資.

实数与代数式是初中数学中重要的基础知识，是中考的必考内容．这部分知识散布于多个章节之中，知识点琐碎，但概念性强，在中考试卷中多以填空题、选择题、化简、探索或求值的形式出现．在复习中，一定要加强对各个概念、性质和公式的辨析和理解．注重让学生在实际背景中理解基本的数量关系和变化规律，注重使学生经历从实际问题中建立数学模.

台灣首府大學樂齡大學講座系列財務規劃與財產繼承主講人:李錦智.

九十五年國文科命題知能研習分享.

生物学新课标（SK）.

第二节人口的空间变化.

2013届高考复习方案（第一轮）专题课件.

第二章不等式與線性規劃 ‧2-1 一元二次不等式 ‧2-2 絕對不等式 ‧2-3 二元一次不等式的圖形 ‧2-4 線性規劃總目錄.

江苏省2008年普通高校招生录取办法常熟理工学院学生处

合同法主讲人：教材：《合同法学》（崔建远） 2017/3/10.

社会保险计划私人经营社会保障的可能性联邦健康保险制度系统的资金融通仍是一个亟待解决的问题医疗费用的风险是一个基本风险吗？

第二章文法和语言 2.1 文法的基本概念符号和符号串 2.2 句型的分析文法和语言的形式定义推导与递归文法的分类语法树

习题与试题认真复习，重点是掌握基本概念。基本概念掌握了，相当一部分试题的解就有了

新准则与老准则主要变更内容.

巧用叠词，妙趣横生.

2016届高三期初调研分析徐国民

第一单元人在社会中生活综合探究一从地图上获取信息第1课时带着地图定向越野间.

二综防火设计分析.

编译原理指导教师:杨建国二零一零年三月.

第2章 LR分析法 LR分析法是一种自下而上进行规范归约的语法分析方法，LR指“自左向右扫描和自下而上进行归约”。LR分析法比递归下降分析法、LL(1)分析法和算符优先分析法对文法的限制要少得多，对大多数用无二义的上下文无关文法描述的语言都可以用LR分析器予以识别，而且速度快，并能准确、及时地指出输入串的任何语法错误及出错位置。LR分析法的一个主要缺点是，若用手工构造分析器则工作量相当大，因此必须求助于自动产生LR分析器的产生器。

我国三大自然区.

第五章电流和电路制作人魏海军

第四章时间序列的分析本章教学目的：①了解从数量方面研究社会经济现象发展变化过程和发展趋势是统计分析的一种重要方法；②掌握时间数列编制的基本要求；③理解和掌握水平速度两方面指标的计算及运用④理解和掌握长期趋势分析和预测的方法。本章教学重点：现象发展的水平指标和速度指标。本章教学难点：现象变动的趋势分析。

第十二单元第28讲第28讲　古代中国的科技和文艺知识诠释　　思维发散.

第4章种群和群落第3节　群落的结构自主学习案　合作探究案课后练习案. 第4章种群和群落第3节　群落的结构自主学习案　合作探究案课后练习案.

江苏省2009年普通高校招生录取办法江苏省教育考试院

编译原理与技术课程总结.

第十三章收入和利润.

！温故知新上下文无关文法最左推导最右推导自上而下自下而上句柄归约移进-归约冲突移进-归约分析递归下降预测分析

Part5语法分析授课：胡静.

编译原理复习.

编译原理(H) 第一次习题课.

第八章第一节日本邹旭丹滨河中学初中部湘教版地理初一年级.

你一定要認識的數學家.

2.2 语法分析器生成器YACC 分析器的构造步骤：产生式→识别活前缀的DFA→分析表（＋驱动器） YACC概述

自上而下分析 4.4.

自上而下分析 4.4.

上次课主要内容正规式的简化形式与辅助定义；记号的识别：有限自动机 NFA的定义：M =（S，∑，move，s0，F）

助教：胡光能，解定宝编译原理讲师：戴新宇

第6章自底向上优先分析法自底向上优先分析概述简单优先分析算符优先分析返回目录.

编译原理与技术词法分析(1) 2018/11/28 《编译原理与技术》讲义.

语言及其文法.

第 12 章　交流電源 …………………………………………………………… 12-1 單相電源 12-2 單相三線式 ※ 12-3 三相電源.

计算理论第2章上下文无关文法.

LR(1)分析方法.

第四章语法分析.

第三章词法分析.

Part5语法分析授课：胡静.

第2次课上下文无关文法

编译原理与技术词法分析 (2) 2018/12/30 《编译原理与技术》讲义.

第五章语法分析——自下而上分析自上而下分析法(Top-down) 自下而上分析法(Bottom-up) 国防科技大学计算机系602教研室.

第三章文法和语言本章目的为语言的语法描述寻求工具,以便：对源程序给出精确无二义的语法描述。（严谨、简洁、易读）

高等数学提高班 (省专升本) 教师：裴亚萍数学教研室：东校区 2118 电话：长号：

第五章自底向上分析方法 LR(0)分析法 1 LR(K)分析法第一个L表示：相应的语法分析将按自左至右的顺序扫描输入符号串；

第二章词法分析3 非确定有限自动机NFA 非确定有限自动机（NFA）的定义 NFA的确定化：NFA到DFA的转换（子集法）

第四章自顶向下语法分析方法语法分析的主要工作：是识别由词法分析给出的单词序列是否是给定的正确句子（程序）。

假有以下之文法產生規則： S→aBc B→bXb B→bX X→a X→ab (a). 字串“ababc”是否可由以上文法產生？ (b)

考前总结背景必要性作用新旧版交替面临一些问题从教学目标和要求说起知识梳理可能有助于提高考试成绩或者让知识掌握得更好.

自底向上的语法分析 4.5.

不等式與線性規劃 ‧一元二次不等式 ‧絕對不等式 ‧二元一次不等式的圖形 ‧線性規劃.

第五章自底向上分析方法 LR(0)分析法 1 LR(K)分析法第一个L表示：相应的语法分析将按自左至右的顺序扫描输入符号串；

大綱：整數的加法整數的減法蘇奕君台灣數位學習科技股份有限公司

9.1.2不等式的性质周村实验中学许伟伟.

第一章集合论集合是最基本的数学概念，没有定义集合是所有数学的基础两种集合论朴素集合论：直观描述集合的概念，有悖论

SLR(1)分析方法.

第四章语法分析南京大学计算机系戴新宇

坚持，努力，机会留给有准备的人第一章四大金融资产总结主讲老师：陈嫣.

编译原理第一章编译程序概述第二章 PL/0编译程序的实现第三章文法和语言第四章词法分析第五章自顶向下语法分析方法

编译原理第一章编译程序概述第二章 PL/0编译程序的实现第三章文法和语言第四章词法分析第五章自顶向下语法分析方法

Presentation transcript:

语法分析本章内容语法分析器：把词法分析生成的词法单元流翻译成语法分析树（parse tree）介绍上下文无关文法、自顶向下和自底向上的分析方法

语法分析器词法分析器 token 源程序分析树前端的其余部分语法分析器中间表示符号表词法分析器 token getNextToken 源程序分析树前端的其余部分语法分析器中间表示符号表实际中，不需要显式地构造出语法分析树，语法分析和前端的其余部分（类型检查、中间代码生成等）交错完成，可以用一个模块来实现。

本章回答四个问题：如何描述一个程序语言的语法结构？上下文无关文法（context-free grammar, CFG）在词法分析中，正则表达式描述了词法结构如何描述一个程序语言的语法结构？上下文无关文法（context-free grammar, CFG）如何进行语法分析？即，给定CFG和词法单元流，如何构造分析树？自顶向下，自底向上如何保证生成的分析树唯一？（二义性问题）给定CFG，如何快速构造语法分析器？语法分析器的生成器Yacc

文法文法（grammar）：程序语言的语法（syntax）的一种精确的、可读的规范描述上下文无关文法通常用Backus-Naur Form (BNF)书写产生式 stmt  if expr then stmt else stmt expr  id | (expr) | expr + expr | expr * expr 终结符、非终结符 if, then, else, +, *, (, ), id; stmt, expr 递归 stmtlist  stmt | stmt; stmtlist “or”

上下文无关文法上下文无关文法是四元组 (VT , VN , S, P) S : 开始符号，非终结符中的一个（S  VN ） P : 产生式集合，产生式形式 : A   例 ( {id, +, , , (, )}, {expr, op}, expr, P ) P = {expr  expr op expr, expr  (expr), expr   expr, expr  id, op  +, op  } 用BNF书写： expr  expr op expr | (expr) |  expr | id op  + | 

上下文无关文法推导（derivations）例 E  E + E | E  E | (E ) |  E | id 记号概念把产生式看成重写规则，把符号串中的非终结符用其产生式右部的串来代替例 E  E + E | E  E | (E ) |  E | id E  E  (E)  (E + E)  (id + E)  (id + id) 记号 S *、 S +  概念句型、句子、上下文无关语言、等价的文法 ，使得 S * 不含非终结符的句型所有句子的集合生成相同语言

上下文无关文法例 E  E + E | E  E | (E ) |  E | id 最左推导 E  lm E  lm (E)  lm (E + E)  lm (id + E) lm (id + id) 最右推导（规范推导） E  rm E  rm (E)  rm (E + E)  rm (E + id) rm (id + id)

上下文无关文法分析树（parse tree）：推导的图形化表示，展示了语言的层次结构，与推导顺序无关例 E  E + E | E  E | (E ) |  E | id (id + id)的分析树 E  E ( E ) E + E id id 每棵分析树对应唯一的最左推导及唯一的最右推导！

二义性例 E  E + E | E  E | (E ) |  E | id E  E  E E  E + E  id  E + E  id  E + E  id  id + E  id  id + E  id  id + id  id  id + id 两个不同的最左推导

二义性例 E  E + E | E  E | (E ) |  E | id E  E  E E  E + E  id  E + E  id  E + E  id  id + E  id  id + E  id  id + id  id  id + id E * + id 两棵不同的分析树

消除二义性方法一：消二义规则（disambiguating rules），如优先级（e.g. *比+具有更高的优先级） 

消除二义性方法二：重写文法！

例 stmt  if expr then stmt | if expr then stmt else stmt | other 考虑 if expr then if expr then stmt else stmt 两个最左推导： stmt  if expr then stmt  if expr then if expr then stmt else stmt stmt  if expr then stmt else stmt 如何重写文法使之无二义？在文法中引入非终结符来表达“优先级”！ if-then-else的优先级高于if-then（第一种推导）

无二义的文法 stmt  matched _stmt | unmatched_stmt matched_stmt  if expr then matched_stmt else matched_stmt | other unmatched_stmt  if expr then stmt | if expr then matched_stmt else unmatched_stmt

有二义的文法： E  E + E | E  E | (E ) |  E | id 另一个例子有二义的文法： E  E + E | E  E | (E ) |  E | id 优先级： () >  (unary minus) > * > + 从高优先级到低优先级构造无二义的文法： element  ( expr ) | id primary   primary | element term  term * primary | primary expr  expr + term | term 考虑  id + id * id 的最左推导 expr  expr + term  term + term  primary + term   primary + term   element + term   id + term   id + term * primary  ... * id + id * id

有二义的文法： S  S and S | S or S | not S | p | q 优先级： not > and > or 第三个例子有二义的文法： S  S and S | S or S | not S | p | q 优先级： not > and > or 从高优先级到低优先级构造无二义的文法： F  not F | p | q T  T and F | F E  E or T | T 考虑 not p and q 的最左推导 E  T  T and F  F and F  not F and F  not p and F  not p and q

有二义的文法： S  S and S | S or S | not S | p | q 优先级： not > and > or 第三个例子有二义的文法： S  S and S | S or S | not S | p | q 优先级： not > and > or 无二义的文法？ F  not E | p | q T  T and F | F E  E or T | T 考虑 not p and q 的最左推导 E  T  T and F  F and F  not E and F  not T and F  not F and F  not p and F  not p and q E  T  F  not E  not T  not T and F

第四个例子设计一个文法：字母表{a, b}上a和b的个数相等的所有串有二义的文法： S  a S b S | b S a S |  S  a B | b A |  A  a S | b A A B  b S | a B B 无二义的文法： S  a B S | b A S |  A  a | b A A B  b | a B B aabbabab S S aabbabab S S aabbabab B B aabbabab B B aabbabab B B a abb abab B S

其他的文法变换消除左递归（在自顶向下分析中有用）将 A  Aa | b 改写为 A  b A A a A | 

消除左递归例算术表达文法 E  E + T | T （ T + T . . . + T ） T  T  F | F （ F  F . . .  F ） F  ( E ) | id 消除左递归后文法 E  TE  E   + TE  |  T  FT  T    F T  | 

消除左递归非直接左递归 S  Aa | b A  Sd |  先变换成直接左递归 A  Aad | bd |  再消除左递归 A  bd A | A A  adA | 

其他的文法变换提取左公因子（在自顶向下分析中有用）将 A  1 | 2 改写为 A   A A  1 | 2

验证文法产生的语言 G : S  (S) S |  L(G) = 配对的括号串的集合按推导步数进行归纳：推出的是配对括号串归纳假设：少于n步的推导都产生配对的括号串归纳步骤：n步的最左推导必然如下形式： S  (S)S * (x) S * (x) y

验证文法产生的语言 G : S  (S) S |  L(G) = 配对的括号串的集合按串长进行归纳：配对括号串可由S推出归纳假设：长度小于2n的都可以从S推导出来归纳步骤：考虑长度为2n(n  1)的w, 则存在x和y使得 w = (x) y 且x和y是配对括号串。所以可构造推导： S  (S)S * (x) S * (x) y

语言和文法文法的优点文法的问题文法给出了精确的，易于理解的语法说明自动产生高效的分析器可以给语言定义出层次结构以文法为基础的语言的实现便于语言的修改文法的问题文法只能描述编程语言的大部分语法，不能描述语言中上下文有关的语法特征

语言和文法适当的表达式文法给我们一种层次观点看待表达式 id  id  (id+id) + id  id + id expr  expr + term | term term  term  factor | factor factor  id | (expr)

语言和文法 expr  expr + term | term term  term  factor | factor factor  id | (expr) expr id term factor * expr + id factor term * id  id  id 分析树 id + id  id 分析树

正则表达式 vs 上下文无关文法正则表达式文法每个正则语言都是一个上下文无关语言，反之不成立 1 2 start a b b 正则表达式 (a|b)*ab 文法 A0  a A0 | b A0 | a A1 A1  b A2 A2   （1）为NFA的每个状态i，创建非终结符Ai （2）对于状态转换：加入Ai  a Aj 或 Ai  Aj （3）若i为接收状态：加入 Ai   （4）若i为开始状态：令Ai为文法的开始符号每个正则语言都是一个上下文无关语言，反之不成立

正则表达式 vs 上下文无关文法正则表达式能定义一些简单的语言，能表示给定结构的固定次数的重复或者没有指定次数的重复例：a (ba)5, a (ba)* 正则表达式不能用于描述配对或嵌套的结构例：配对括号串的集合每个正则语言都是一个上下文无关语言，反之不成立

正则表达式 vs 上下文无关文法 S  aSb | ab L ={anbn | n  1} L是不能用正则表达式描述的语言的一个范例若存在接受L 的DFA D，状态数为k个设D读完, a, aa, …, ak 分别到达状态s0, s1, …, sk 至少有两个状态相同，例如是si和sj，则ajbi属于L si … f s0 标记为ai的路径标记为bi的路径标记为aj  i的路径

分离词法分析器的理由为什么要用正则表达式定义词法词法规则非常简单，不必用上下文无关文法对于词法记号，正则表达式描述简洁且易于理解从正则表达式构造出的词法分析器效率高

分离词法分析器的理由从软件工程角度看，词法分析和语法分析的分离有如下好处简化设计编译器的效率会改进编译器的可移植性加强便于编译器前端的模块划分

分离词法分析器的理由能否把词法分析并入到语法分析中，直接从字符流进行语法分析若把词法分析和语法分析合在一起，则必须将语言的注解和空白的规则反映在文法中，文法将大大复杂注解和空白由自己来处理的分析器，比注解和空格已由词法分析器删除的分析器要复杂得多

非上下文无关的语言 L1 = {wcw | w属于(a | b)*} L2 = {anbmcndm | n  0, m  0} 标识符的声明应先于其引用的抽象 L2 = {anbmcndm | n  0, m  0} 形参个数和实参个数应该相同的抽象方法一：用上下文敏感文法方法二：不在文法中描述，在语义分析阶段检查

语法分析语法分析器：给定一个句子，构造该句子的推导语法分析器都从左至右地扫描输入，但有不同的方式构造分析树词法分析器 token 词法分析器 token getNextToken 源程序分析树前端的其余部分语法分析器中间表示符号表语法分析器：给定一个句子，构造该句子的推导语法分析器都从左至右地扫描输入，但有不同的方式构造分析树自顶向下：从根节点开始向叶节点构造自底向上：从叶节点开始向根节点构造

自顶向下的语法分析从文法的开始符号开始，猜测用哪个产生式推导例文法 S  aCb C  cd | c 用下一个输入符号来指导“猜测” 例文法 S  aCb C  cd | c 为输入串w = acb建立分析树 S a C b S a C b c d S a C b c 对C用哪个产生式？用C的第一个产生式猜错了！回溯，试第二个产生式

自顶向下的语法分析不能处理左递归例算术表达文法 E  E + T | T T  T  F | F F  ( E ) | id 例算术表达文法 E  E + T | T T  T  F | F F  ( E ) | id E E + T E + T E + T … … …

自顶向下的语法分析不能处理左递归复杂的回溯技术回溯导致语义工作推倒重来难以报告出错的确切位置效率低

自顶向下的语法分析对文法加什么样的限制可以保证没有回溯？ LL(k)文法书上：递归下降分析技术，针对LL(1)文法的预测分析技术

自底向上的语法分析构造分析树：从叶节点开始向上到根节点总是构造最右推导算法：移进-归约（shift-reduce）将一个串w“归约”为文法开始符号关键：寻找与某产生式右部相匹配的子串

归约例 S  aABe A  Abc | b B  d

归约例 S  aABe A  Abc | b B  d abbcde（读入ab） a b

归约例 S  aABe A  Abc | b B  d abbcde aAbcde（归约） a b A

归约例 S  aABe A  Abc | b B  d abbcde aAbcde（再读入bc） a b A c

归约例 S  aABe A  Abc | b B  d abbcde aAbcde aAde（归约） a b A c

归约例 S  aABe A  Abc | b B  d abbcde aAbcde aAde（再读入d） a b A d c

归约 a 例 S  aABe A  Abc | b B  d abbcde aAbcde aAde aABe（归约） b A d c

归约 a 例 S  aABe A  Abc | b B  d abbcde aAbcde aAde aABe(再读入e) e b A

归约 a 例 S  aABe A  Abc | b B  d abbcde aAbcde aAde aABe S（归约） S e b

归约 a 例 S  aABe A  Abc | b B  d abbcde aAbcde aAde aABe S S rm aABe rm aAde rm aAbcde rm abbcde S e a b A d c B

句柄（Handles）句型的句柄是和某产生式右部匹配的子串，并且，把它归约成该产生式左部的非终结符代表了最右推导的一个反向步骤 S  aABe A  Abc | b B  d S rm aABe rm aAde rm aAbcde rm abbcde 句柄右边的串一定仅含终结符如果文法二义，那么句柄可能不唯一

句柄（Handles）例句柄不唯一 E  E + E | E  E | (E ) | id E rm E  E 例句柄不唯一 E  E + E | E  E | (E ) | id E rm E  E rm E  E + E rm E  E + id3 rm E  id2 + id3 rm id1  id2 + id3 E rm E + E rm E + id3 rm E  E + id3 rm E  id2 + id3 rm id1  id2 + id3 在句型E  E + id3中，句柄不唯一

句柄（Handles）例 E  E + T | T T  T  F | F F  ( E ) | id E rm E + T rm E + F rm E + id3 rm T + id3 rm T  F + id3 rm T  id2 + id3 rm F  id2 + id3 rm id1  id2 + id3 无二义的文法，句柄唯一

移进-归约语法分析技术使用一个栈移进：将输入符号移进栈中，直到发现一个句柄归约：对句柄进行归约接受：栈中包含文法开始符号，无更多输入报错：语法错误下面以id1  id2 + id3为例

栈输入动作 $ id1  id2 + id3$

栈输入动作 $ id1  id2 + id3$ 移进

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3 $EE+E

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3 $EE+E 按E  E+E归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3 $EE+E 按E  E+E归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3 $EE+E 按E  E+E归约按E  EE归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3 $EE+E 按E  E+E归约按E  EE归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3 $EE+E 按E  E+E归约按E  EE归约接受

移进-归约要想很好地使用移进归约方式，尚需解决一些问题如何决策选择移进还是归约进行归约时，确定右句型中将要归约的子串进行归约时，如何确定选择哪一个产生式

移进-归约分析中的冲突 1、移进归约冲突 E rm E  E rm E  E + E rm E  E + id3 例 E  E + E | E  E | (E ) | id E rm E  E rm E  E + E rm E  E + id3 rm E  id2 + id3 rm id1  id2 + id3 E rm E + E rm E + id3 rm E  E + id3 rm E  id2 + id3 rm id1  id2 + id3

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$ $E+id3

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$ $E+id3

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$ $E+id3 $E+E

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$ $E+id3 $E+E 按E  E+E归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$ $E+id3 $E+E 按E  E+E归约

栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$ $E+id3 $E+E 按E  E+E归约接受

E rm E  E rm E  E + E rm E  E + id3 rm E  id2 + id3 rm id1  id2 + id3 E rm E + E rm E + id3 rm E  E + id3 rm E  id2 + id3 rm id1  id2 + id3 栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE $EE+ id3$ $EE+id3 $EE+E 按E  E+E归约按E  EE归约接受栈输入动作 $ id1  id2 + id3$ 移进 $ id1  id2 + id3$ 按E  id归约 $E $E id2 + id3$ $Eid2 + id3$ $EE 按E  EE归约 $E+ id3$ $E+id3 $E+E 按E  E+E归约接受

移进-归约分析中的冲突 1、移进归约冲突例 stmt  if expr then stmt | if expr then stmt else stmt | other 如果移进归约分析器处于格局栈输入 … if expr then stmt else … $ if-then-else的优先级高于if-then（选择移进）

移进-归约分析中的冲突归约成expr还是parameter ? 2、归约归约冲突 stmt  id (parameter_list) | expr = expr parameter_list  parameter_list, parameter | parameter parameter  id expr  id (expr_list) | id expr_list  expr_list, expr | expr 由A(I, J)开始的语句栈输入 … id ( id , id )… 归约成expr还是parameter ?

移进-归约分析中的冲突 2、归约归约冲突 stmt  id (parameter_list) | expr = expr parameter_list  parameter_list, parameter | parameter parameter  id expr  id (expr_list) | id expr_list  expr_list, expr | expr 由A(I, J)开始的语句(词法分析查符号表,区分第一个id) 栈输入 … procid ( id , id )… 需要修改上面的文法

LR分析目前最流行的语法分析技术 LR(k)分析：移进-归约分析特点 L：从左往右扫描输入 R：反向构造一个最右推导序列 k：向前看k个符号（通常k<=1, 缺省为1）以帮助做出移进或归约的决定特点适用于一大类上下文无关文法（LR文法）效率高

所有LR分析器的驱动程序是相同的，分析表可以不同输入 LR分析程序输出栈 action goto sm Xm sm-1 Xm-1 … s0 a1 ai an $ 分析表所有LR分析器的驱动程序是相同的，分析表可以不同

LR分析 Configuration（分析过程中的中间状态） (s0X1s1X2s2…Xmsm, aiai+1ai+2…an$) 分析表：action[s, a]和goto[s, A] Table action[s, a] ---- s: state, a: terminal entries: (1) shift s (2) reduce A   (3) accept (4) error Table goto[s, A] ---- s: state, A: non-terminal entries are states 由sm和ai决定下一步是什么状态文法符号终结符

LR分析给定config: (s0X1s1X2s2…Xmsm, aiai+1ai+2…an$) 1）若action[sm, ai]是“shift s”，则进入config (s0X1s1X2s2…Xmsmais, ai+1ai+2…an$) 2）若action[sm, ai]是“reduce A  ”，则进入config (s0X1s1X2s2…Xm-rsm-rAs, aiai+1ai+2…an$) 其中 r = ||,  = Xm-r+1Xm-r+2…Xm, s = goto[sm-r, A] 3）若action[sm, ai]是“accept”，则完成分析 4）若action[sm, ai]是“error”，则调用错误恢复

例 (1) E  E + T (2) E  T (3) T  T  F (4) T  F (5) F  ( E ) (6) F  id 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc 2 r2 s7 r2 r2 3 r4 r4 r4 r4 4 8 2 3 … （书上149页图4-37）

栈输入动作 id  id + id $ 移进 E  E + T E  T T  T  F T  F F  ( E ) 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 id  id + id $ 移进

栈输入动作 id  id + id $ 移进 0 id 5  id + id $ E  E + T E  T 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 id  id + id $ 移进 0 id 5  id + id $

栈输入动作 id  id + id $ 移进 0 id 5  id + id $ 按F  id归约 E  E + T 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 id  id + id $ 移进 0 id 5  id + id $ 按F  id归约

栈输入动作 id  id + id $ 移进 0 id 5  id + id $ 按F  id归约 0 F 3 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 id  id + id $ 移进 0 id 5  id + id $ 按F  id归约 0 F 3

栈输入动作 id  id + id $ 移进 0 id 5  id + id $ 按F  id归约 0 F 3 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 id  id + id $ 移进 0 id 5  id + id $ 按F  id归约 0 F 3 按T  F归约

栈输入动作 id  id + id $ 移进 0 id 5  id + id $ 按F  id归约 0 F 3 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 id  id + id $ 移进 0 id 5  id + id $ 按F  id归约 0 F 3 按T  F归约 0 T 2

栈输入动作 0 T 2  id + id $ E  E + T E  T T  T  F T  F F  ( E ) 状态 action goto id +  ( ) $ E T F … 2 r2 s7 r2 r2 5 r6 r6 r6 r6 7 s5 s4 10 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  id + id $

栈输入动作 0 T 2  id + id $ 移进 E  E + T E  T T  T  F T  F 状态 action goto id +  ( ) $ E T F … 2 r2 s7 r2 r2 5 r6 r6 r6 r6 7 s5 s4 10 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  id + id $ 移进

栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $ E  E + T E  T 状态 action goto id +  ( ) $ E T F … 2 r2 s7 r2 r2 5 r6 r6 r6 r6 7 s5 s4 10 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $

栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $ E  E + T E  T 状态 action goto id +  ( ) $ E T F … 2 r2 s7 r2 r2 5 r6 r6 r6 r6 7 s5 s4 10 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $

栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $ 0 T 2  7 id 5 状态 action goto id +  ( ) $ E T F … 2 r2 s7 r2 r2 5 r6 r6 r6 r6 7 s5 s4 10 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $ 0 T 2  7 id 5 + id $

栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $ 0 T 2  7 id 5 状态 action goto id +  ( ) $ E T F … 2 r2 s7 r2 r2 5 r6 r6 r6 r6 7 s5 s4 10 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $ 0 T 2  7 id 5 + id $ 按F  id归约

栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $ 0 T 2  7 id 5 状态 action goto id +  ( ) $ E T F … 2 r2 s7 r2 r2 5 r6 r6 r6 r6 7 s5 s4 10 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  id + id $ 移进 0 T 2  7 id + id $ 0 T 2  7 id 5 + id $ 按F  id归约 0 T 2  7 F 10

栈输入动作 0 T 2  7 F 10 + id $ E  E + T E  T T  T  F T  F 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc 2 r2 s7 r2 r2 … 10 r3 r3 r3 r3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  7 F 10 + id $

栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 E  E + T E  T T  T  F 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc 2 r2 s7 r2 r2 … 10 r3 r3 r3 r3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约

栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 E  E + T E  T 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc 2 r2 s7 r2 r2 … 10 r3 r3 r3 r3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2

栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 按E  T归约 E  E + T 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc 2 r2 s7 r2 r2 … 10 r3 r3 r3 r3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 按E  T归约

栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 按E  T归约 0 E 1 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc 2 r2 s7 r2 r2 … 10 r3 r3 r3 r3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 按E  T归约 0 E 1

栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 按E  T归约 0 E 1 移进状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc 2 r2 s7 r2 r2 … 10 r3 r3 r3 r3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 按E  T归约 0 E 1 移进

栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 按E  T归约 0 E 1 移进状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc 2 r2 s7 r2 r2 … 10 r3 r3 r3 r3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 T 2  7 F 10 + id $ 按T  TF归约 0 T 2 按E  T归约 0 E 1 移进 0 E 1 + 6 id $

栈输入动作 0 E 1 + 6 id $ E  E + T E  T T  T  F T  F F  ( E ) 状态 action goto id +  ( ) $ E T F … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 6 s5 s4 9 3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 id $

栈输入动作 0 E 1 + 6 id $ 移进 E  E + T E  T T  T  F T  F F  ( E ) 状态 action goto id +  ( ) $ E T F … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 6 s5 s4 9 3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 id $ 移进

栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ E  E + T E  T T  T  F 状态 action goto id +  ( ) $ E T F … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 6 s5 s4 9 3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $

栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ 按F  id归约 E  E + T E  T 状态 action goto id +  ( ) $ E T F … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 6 s5 s4 9 3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ 按F  id归约

栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ 按F  id归约 0 E 1 + 6 F 3 状态 action goto id +  ( ) $ E T F … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 6 s5 s4 9 3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ 按F  id归约 0 E 1 + 6 F 3

栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ 按F  id归约 0 E 1 + 6 F 3 状态 action goto id +  ( ) $ E T F … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 6 s5 s4 9 3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ 按F  id归约 0 E 1 + 6 F 3 按T  F归约

栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ 按F  id归约 0 E 1 + 6 F 3 状态 action goto id +  ( ) $ E T F … 3 r4 r4 r4 r4 5 r6 r6 r6 r6 6 s5 s4 9 3 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 id $ 移进 0 E 1 + 6 id 5 $ 按F  id归约 0 E 1 + 6 F 3 按T  F归约 0 E 1 + 6 T 9

栈输入动作 0 E 1 + 6 T 9 $ E  E + T E  T T  T  F T  F F  ( E ) 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc … 9 r1 s7 r1 r1 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 T 9 $

栈输入动作 0 E 1 + 6 T 9 $ 按E  E+T归约 E  E + T E  T T  T  F T  F 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc … 9 r1 s7 r1 r1 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 T 9 $ 按E  E+T归约

栈输入动作 0 E 1 + 6 T 9 $ 按E  E+T归约 0 E 1 E  E + T E  T T  T  F 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc … 9 r1 s7 r1 r1 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 T 9 $ 按E  E+T归约 0 E 1

栈输入动作 0 E 1 + 6 T 9 $ 按E  E+T归约 0 E 1 接受 E  E + T E  T 状态 action goto id +  ( ) $ E T F s5 s4 1 2 3 1 s6 acc … 9 r1 s7 r1 r1 E  E + T E  T T  T  F T  F F  ( E ) F  id 栈输入动作 0 E 1 + 6 T 9 $ 按E  E+T归约 0 E 1 接受

LR分析最右推导的反向过程若文法二义，分析表action的某些条目会包含多个动作：移进-归约冲突，归约-归约冲突解决冲突：(1) 重写文法 (2) 分析表中只留下一个动作 LR(k)分析：由状态和接下来的k个输入符号决定下一步是什么，一般k=0或1 LR(k)文法：LR(k)分析表的每个条目都是唯一的如何构造LR分析表？三个著名变体：SLR(1), LR(1), LALR(1) (具体算法见书)

下面文法不是LR(1)的： L  M L b | a M   M b L a  句子abbb的分析树

LR语法分析中的错误恢复（1） LR语法分析器查询goto表时不会发现错误。但是可能在查询action表时发现报错条目假设栈中的符号串为α，当前输入符号为a；报错表示不可能存在终结符号串x使得αax是一个最右句型。恐慌模式的错误恢复策略从栈顶向下扫描，找到状态s，s有一个对应于非终结符号A的 goto目标；（s之上的状态被丢弃）在输入中读入并丢弃一些符号，直到找到一个可以合法跟在A之后的符号a（不丢弃a）；将goto(s,A)压栈；继续进行正常的语法分析。基本思想：假定当前正在试图归约到A且碰到了语法错误。因此设法扫描完包含语法错误的A的子串，假装找到了A的一个实例 A的选择可能很多

LR语法分析中的错误恢复（2）短语层次的恢复

LR分析器的模型输入 LR分析程序输出栈 action goto sm Xm Xm-1 … s0 a1 ai an $ 分析表这实际上是一个下推自动机（Pushdown Automaton, PDA）

下推自动机（PDA） PDA = NFA + a stack read: pop; write: push

“Pushdown”

PDA CFG是上下文无关语言的描述方法 PDA是上下文无关语言的识别方法 CFG就像正则表达式，PDA就像有限自动机两种方法证明一个语言是上下文无关语言： 1. 设计CFG，并证明它能产生该语言 2. 构造PDA，并证明它能识别该语言

栈带来的好处栈：类似无限的存储空间 PDA可以识别非正则语言如 {0n1n | n  0} 有限自动机：有限的状态个数

识别{anbn | n  0}的PDA 读入输入字符接受：输入结束，且栈为空反之报错每读入一个0，则将它入栈每读入一个1，则出栈一个0 接受：输入结束，且栈为空反之报错

到目前为止：如何描述一个程序语言的语法结构？上下文无关文法（context-free grammar, CFG）自顶向下，自底向上如何保证生成的分析树唯一？（二义性问题）给定CFG，如何快速构造语法分析器？语法分析器的生成器Yacc   

语法分析器的生成器Yacc Yacc源程序 Yacc y.tab.c translate.y 编译器 C a.out 输出输入 C语言写的LALR语法分析器文法规范 Yacc 编译器 Yacc源程序 translate.y y.tab.c C a.out 输入输出

Yacc源程序的结构声明翻译规则辅助性C语言例程分为可选的两节：第一节放置C声明，第二节是对词法单元的声明 %% 翻译规则辅助性C语言程序声明分为可选的两节：第一节放置C声明，第二节是对词法单元的声明翻译规则指明产生式及相关联的语义动作辅助性C语言例程被直接拷贝到生成的C语言源程序中可以在语义动作中调用其中必须包括yylex()，这个函数返回词法单元，可以由Lex生成

C声明、词法单元声明翻译规则：产生式及相关联的语义动作辅助性C语言例程

Yacc对于冲突的处理 Yacc使用LR分析(LALR)，当文法有二义时，生成的分析表action将包含冲突缺省的处理方法对于归约-归约冲突，选择前面的产生式对于移进-归约冲突，总是移进（悬空-else的解决）用户可以声明终结符和产生式的优先级和结合性，来解决移进-归约冲突

Yacc对于冲突的处理声明终结符的优先级和结合性 %left ‘||’ %left ‘&&’ %noassoc ‘==’ ‘!=’ ‘<’ ‘>’ ‘<=’ ‘>=’ %left ‘+’ ‘’ %left ‘*’ ‘/’ 低优先级高优先级

Yacc对于冲突的处理产生式的优先级是它的最右终结符的优先级指定产生式的优先级：%prec 终结符 …… %left ‘+’ ‘’ %right UMINUS %% expr : expr ‘+’ expr {$$ = $1 + $3; } | expr ‘’ expr {$$ = $1  $3; } | ‘’ expr %prec UMINUS {$$ = $2; } UMINUS具有最高优先级这个产生式的优先级与UMINUS相同 -5+10看成是-(5+10), 还是(-5)+10? 取后者

本章小结文法和语言的基本知识分析方法：自顶向下，自底向上二义性问题