第6章 自底向上优先分析法 自底向上优先分析概述 简单优先分析 算符优先分析 返回目录
自底向上分析方法 自底向上分析方法,也称移进-归约分析法。 实现思想: 对输入符号串自左向右进行扫描,并将输入符逐个移入一个后进先出栈中,边移入边分析,一旦栈顶符号串形成某个句型的句柄时,(该句型对应某产生式的右部),就用该产生式的左部非终结符代替相应右部的文法符号串,这称为归约。 重复这一过程直到归约到栈中只剩文法的开始符号时则为分析成功,也就确认输入串是文法的句子。
A A S B a b b c d e S aAcBe aAcde aAbcde abbcde 步骤 符号栈 输入符号串 动作 文法G[S]: (1) S → aAcBe (2) A → b (3) A → Ab (4) B → d 1) # abbcde# 移进 2) #a bbcde# 移进 A 3) #ab bcde# 归约(A→b) 4) #aA bcde# 移进 A 5) #aAb cde# 归约(A→Ab) 6) #aA cde# 移进 S 10) #aAcBe # 归约(S→aAcBe) 7) #aAc de# 移进 B 8) # aAcd e# 归约(B→d) 9) #aAcB e# 移进 11) #S # 接受 对输入串abbcde#的移进-规约分析过程 分析符号串abbcde是否为G[S]的句子? a b b c d e S aAcBe aAcde aAbcde abbcde
算法应考虑的问题 算法是否能够终止? 算法是否快速? 算法是否能够处理所有的情况? 在每一步中如何选择子串进行归约?
自下而上语法分析的策略:移进-规约分析。 移进就是将一个终结符推进栈。 归约就是将0个或多个符号从栈中弹出,根据产生式将一个非终结符压入栈。 移进-归约过程是自顶向下最右推导的逆过程(规范归约)。
优先分析法 简单优先分析法 对一个文法按一定原则求出该文法所有符号(终结符和非终结符)之间的优先关系,按照这种关系确定归约过程中的句柄,它的归约实际上是一种规范归约。 算符优先分析法 只规定算符(终结符)之间的优先关系。找到句柄就归约,不是规范归约。
简单优先分析法 按照文法符号(包括终结符和非终结符) 的优先关系确定句柄。
文法G[S]: (1) S → bAb (2) A → (B|a (3) B → Aa) 步骤 符号栈 输入符号串 动作 1) # b(aa)b# #<b,移进 2) #b (aa)b# b<(,移进 3) #b( aa)b# (<a,移进 4) #b(a a)b# a>a,归约A→a 5) #b(A a)b# A=a,移进 6) #b(Aa )b# a=),移进 7) #b(Aa) b# )>b,归约B→Aa) 8) #b(B b# B>b,归约A→(B 9) #bA b# A=b,移进 10) #bAb # b>#,归约S→bAb 11) #S # 接受 简单优先关系矩阵 对输入串b(aa)#的简单优先分析过程
优先关系 优先关系 X=Y 文法G中存在产生式A→...XY... X<Y 文法G中存在产生式A→...XB..., 且B Y... X>Y 文法G中存在产生式A→...BD..., 且B ...X,D Y... 如何确定两个文法符号之间的优先关系? 返回调用
简单优先文法的定义 满足以下条件的文法是简单优先文法 (1)在文法符号集V中,任意两个符号之间最多只有一种优先关系成立。 (2)在文法中任意两个产生式没有相同的右部。 (3)不含空产生式。
简单优先分析法 根据已知优先文法构造相应优先关系矩阵,并将文法的产生式保存,设置符号栈S,算法步骤如下: 将输入符号串a1a2a3...an#依次逐个存入符号栈S中,直到遇到栈顶符号ai的优先性>下一个待输入符号aj时为止。 栈顶当前符号ai为句柄尾,由此向左在栈中找句柄的头符号ak,即找到ak-1<ak为止。 由句柄ak...ai在文法的产生式中查找右部为ak...ai的产生式,若找到则用相应左部代替句柄,若找不到则为出错,这时可断定输入串不是该文法的句子。 重复上述三步,直到归约完输入符号串,栈中只剩文法的开始符号为止。
如何确定优先关系? 1.求=关系: 由(1):b=A A=b 由(2):(=B 由(3):A=a a=) 2.求<关系: 3.求>关系: 由(1):B>b a>b )>b 由(3):B>a a>a )>a 4.#<所有符号,所有符号># 文法G[S]: (1) S → bAb (2) A → (B|a (3) B → Aa) 查看关系定义
算符优先分析法 某些文法具有“算符”特性 表达式运算符(优先级、结合性) 人为地规定其算符的优先顺序,即给出优先级别和同一级别的结合性 只考虑算符之间的优先关系来确定句柄
文法G[E]:E→E+E|E-E|E*E|E/E|EE|(E)|i 步骤 符号栈 输入符号串 动作 1) # i+i*i# #<i,移进 2) #i +i*i# #<i>+,规约 3) #E +i*i# #<+,移进 4) #E+ i*i# +<i,移进 5) #E+i *i# +<i>*,规约 6) #E+E *i# +<*,移进 7) #E+E* i# *<i,移进 8) #E+E*i # *<i>#,规约 9) #E+E*E # +<*>#,规约 10) #E+E # #<+>#,规约 11) #E # 接受 算符优先关系表 对输入串i+i*i的算符优先分析过程
如何确定算符优先关系? 文法G[E]:E→E+E|E-E|E*E|E/E|EE|(E)|i i的优先级最高 优先级次于i,右结合 *和/优先级次之,左结合 +和-优先级最低,左结合 括号‘(’,‘)’的优先级大于括号外的运算符,小于括号内的运算符,内括号的优先性大于外括号 #的优先性低于与其相邻的算符 算符优先关系表
算符文法的定义 定义 如果不含空产生式的上下文无关文法 G 中没有形如 U…VW…的产生式,其中V,W∈VN则称G 为算符文法(OG)。 性质1:在算符文法中任何句型都不包含两个相邻的非终结符.(数学归纳法) 性质2:如 Vx 或 xV 出现在算符文法的句型 中,其中V∈VN,x∈VT, 则 中任何含 x 的短语必含有V.(反证法)
算符优先关系的定义 在OG中 定义 (算符优先关系) x = y G中有形如.U…xy…或U …xVy..的产生式。 x < y G中有形如.U …xW…的产生式,而 W y….或W Vy… x>y G中有形如.U …Wy…的产生式,而 W …x或W … xV 规定 若 S x…或S Vx… 则 # < x 若S …x或S …xV 则 x > #
算符优先文法的定义 在 OG文法 G 中,若任意两个终结符间至多有一种算符优先关系存在,则称G 为算符优先文法(OPG)。 注意:允许b>c,c>b;不允许b>c,b<c,b=c 结论: 算符优先文法是无二义的。
算符优先关系表的构造 由定义直接构造 由关系图法构造算符优先关系表
首先引入两个概念 FIRSTVT(B)={b|B b…或B Cb...}对于非终结符B,其往下推导所可能出现的首个算符。 LASTVT(B)={a|B … a或B ... aC}对于非终结符B,其往下推导所可能出现的最后一个算符。
如何计算算符优先关系 1) ‘=‘关系 直接看产生式的右部,若出现了 A →…ab…或A →…aBb,则a=b。 2)’<‘关系 求出每个非终结符B的FIRSTVT(B), 若A→…aB…,则b∈FIRSTVT(B),则a<b。 3)’>’关系 求出每个非终结符B的LASTVT(B), 若A→…Bb…,则a∈LASTVT(B),则a>b。
FIRSTVT(E’)={#} FIRSTVT(E)={+,. ,,(,i} FIRSTVT(T)={ FIRSTVT(E’)={#} FIRSTVT(E)={+,*,,(,i} FIRSTVT(T)={*,,(,i} FIRSTVT(F)={,(,i} FIRSTVT(P)={(,i} LASTVT(E’)={#} LASTVT(E)={+,*,,),i} LASTVT(T)={*,,),i} LASTVT(F)={,),i} LASTVT(P)={),i} 1)‘=’关系 由产生式(0)和(6),得 #=#,(=) 2)‘<’关系 找形如:A→…aB…的产生式 #E:则#<FIRSTVT(E) +T: 则+<FIRSTVT(T) *F: 则*<FIRSTVT(F) F:则 <FIRSTVT(F) (E: 则 (<FIRSTVT(E) 文法G[E]: (0) E’→#E# (1) E→E+T (2) E→T (3) T→T*F (4) T→F (5) F→PF|P (6) P→(E) (7) P→i 3)‘>’关系 找形如:A→…Bb…的产生式 E# ,则 LASTVT(E)># E+ ,则 LASTVT(E)>+ T* ,则 LASTVT(T)>* P ,则 LASTVT(P)> E) ,则 LASTVT(E)>)
算符优先分析算法 归约过程中,只考虑终结符之间的优先关系来确定句柄,而与非终结符无关。这样去掉了单非终结符的归约,所以用算符优先分析法的规约过程与规范归约是不同的,P110. 为解决在算符优先分析过程中如何寻找句柄,引进最左素短语的概念。
最左素短语 算符文法的任一句型有如下形式: #N1a1N2a2......NnanNn+1#,若Niai......NjajNj+1为句柄,则有 ai-1<ai=ai=...= aj-1 = aj> ai+1 对于算符优先文法,如果aNb(或ab)出现在句型r中 若a<b,则在r中必含有b而不含a的短语存在。 若a>b,则在r中必含有a而不含b的短语存在。 若a=b,则在r中含有a的短语必含有b,反之亦然。 定义 cfg G 的句型的素短语是一个短语,它至少包含一个终结符,且除自身外不再包含其他素短语。处于句型最左边的素短语为最左素短语。
句型#T+T*F+i# 其短语有: T+T*F+i T+T*F T T*F i E 文法G[E]: (1) E→E+T (2) E→T (3) T→T*F (4) T→F (5) F→PF|P (6) P→(E) (7) P→i 句型#T+T*F+i# 其短语有: T+T*F+i T+T*F T T*F i E E + T E + T F T T * F i 最左素短语为:T*F N 句型#N+N*N+i#的归约过程 N + N N + N i N * N
优先函数 优先函数比优先矩阵节省空间 当发生错误时不能准确指出出错位置 如:i+ii*i#,两个相邻i不存在优先关系,但优先函数存在,会归约成N+NN...而发现错误。 优先函数的构造 由定义直接构造 用关系图构造优先函数
算符优先分析法的局限性 一般语言的方法很难满足算符优先文法的条件。 很难避免把错误的句子得到正确的归约。