编译原理与技术 课程总结.

Slides:



Advertisements
Similar presentations
說 劍 《莊子‧雜篇》─ 第 一 組 賴泊錞 謝孟儒 張維真 羅苡芸
Advertisements

第一节 人口的数量变化.
诚信为本、操守为重、坚持准则、不做假账 第 九 章 会 计 报 表.
温 度 定义: 表示物体冷热程度的物理量。 国际单位:开尔文(K) 单位 常用单位:摄氏度(℃) 原理: 根据液体热胀冷缩的性质制成的。
行政诉讼法.
前进中的山东省昌乐二中.
江苏省2008年普通高校 招生录取办法 常熟理工学院学生处
第二章 文法和语言 2.1 文法的基本概念 符号和符号串 2.2 句型的分析 文法和语言的形式定义 推导与递归 文法的分类 语法树
习题与试题 认真复习,重点是掌握基本概念。基本概念掌握了,相当一部分试题的解就有了
第一章 C语言概述 计算机公共教学部.
必修Ⅰ 地球上的水 第三章.
紧扣课程标准 关注社会热点 —苏教版教材新增内容复习建议 南京市南湖第一中学 马 峰.
岳阳市教学竞赛课件 勾股定理 授课者 赵真金.
财经法规与会计职业道德 (3) 四川财经职业学院.
<<广东省中小学生体能素质评价标准>>
你不得不知的几件事 2、图书《10天行测通关特训》 3、网络课程 《网校9元课程系列》《考前强化夜校班》 4、地面课程 《10天10晚名师密授营》《考前预测集训营》
第2章 LR分 析 法 LR分析法是一种自下而上进行规范归约的语法分析方法,LR指“自左向右扫描和自下而上进行归约”。LR分析法比递归下降分析法、LL(1)分析法和算符优先分析法对文法的限制要少得多,对大多数用无二义的上下文无关文法描述的语言都可以用LR分析器予以识别,而且速度快,并能准确、及时地指出输入串的任何语法错误及出错位置。LR分析法的一个主要缺点是,若用手工构造分析器则工作量相当大,因此必须求助于自动产生LR分析器的产生器。
安全系着你我他 安全教育知识竞赛.
二、选择题 (一)A1型题 1. 四君子汤的功用是 : A.益气健脾 B.益气补中 C.健脾养胃 D. 健脾和胃 E.益气和胃 回答正确,
面向海洋的开放地区——珠江三角洲 山东省高青县实验中学:郑宝田.
选择,是一种大智慧 ——对新高考方案的 解读与思考.
第十二单元 第28讲 第28讲 古代中国的科技和文艺   知识诠释  思维发散.
“08高考化学学业水平(必修科目)测试的命题和教学对策研究”
第四课时 常见天气系统 阜宁一中 姚亚林.
电在我们日常生活、现代化社会中的应用: 电 是 什 么?.
台州市2011年科学学业考试试题的命制 台州初级中学 郭海平.
江苏省2009年普通高校 招生录取办法 江苏省教育考试院
第十三章 收入和利润.
! 温故知新 上下文无关文法 最左推导 最右推导 自上而下 自下而上 句柄 归约 移进-归约冲突 移进-归约分析 递归下降预测分析
Part5语法分析 授课:胡静.
编译原理复习.
Chapter 5 利率的風險結構與期間結構. Chapter 5 利率的風險結構與期間結構.
第4章 选择结构程序设计 在现实生活中,需要进行判断和选择的情况是很多的 如果你在家,我去拜访你 如果考试不及格,要补考
第四章第一节 增值税法律制度2 主讲老师:梁天 经济法基础.
上次课主要内容 正规式的简化形式与辅助定义; 记号的识别:有限自动机 NFA的定义:M =(S,∑,move,s0,F)
第6章 自底向上优先分析法 自底向上优先分析概述 简单优先分析 算符优先分析 返回目录.
如何寫工程計畫書 臺北市童軍會考驗委員會 高級考驗營 版.
编译原理 第三章 词法分析.
語法與修辭 骨&肉 老師:歐秀慧.
LR(1)分析方法.
Part5语法分析 授课:胡静.
第3讲 C++程序控制结构 3.1 顺序结构 3.2 分支结构 3.3 循环结构 3.4 转向控制 3.5 综合案例分析.
第五章 语法分析——自下而上分析 自上而下分析法(Top-down) 自下而上分析法(Bottom-up) 国防科技大学计算机系602教研室.
语法分析 本章内容 语法分析器:把词法分析生成的词法单元流翻译成语法分析树(parse tree)
蔣梅香 資深協理 金融機構評等部 中華信用評等公司
第二章 词法分析4 词法分析程序实现 构造词法分析器步骤 单词的形式化描述 词法分析程序的实现.
第五章 自底向上分析方法 LR(0)分析法 1 LR(K)分析法 第一个L表示:相应的语法分析将按自左至右的顺序扫描输入符号串;
第1讲 C语言基础 要求: (1) C程序的组成 (2) C语言的标识符是如何定义的。 (3) C语言有哪些基本数据类型?各种基本数
程式結構&語法.
材料二甲 授課教師:王致傑 老師 (學420、分機5305)
第四章 自顶向下语法分析方法 语法分析的主要工作:是识别由词法分析给出的单词 序列是否是给定的正确句子(程序)。
第三章 C++的语句和简单的程序设计 主要内容:
第二部分 集合论 第六章 集合代数 主要内容 集合的基本概念 属于、包含 幂集、空集 文氏图等 集合的基本运算 并、交、补、差等 集合恒等式
考前总结 背景 必要性 作用 新旧版交替面临一些问题 从教学目标和要求说起 知识梳理 可能有助于提高考试成绩 或者让知识掌握得更好.
1. 求真空中一长为L、总电量为q的均匀带电细直线杆延长线上的电场强度。
基础会计.
大綱:整數的加法 整數的減法 蘇奕君 台灣數位學習科技股份有限公司
植物激素的调节 一、生长素的发现过程 动物激素是由内分泌细胞合成与分泌。 1、达尔文实验:①证明单侧光照射能使 产生
第八节 算术运算符和算术表达式.
SLR(1)分析方法.
1.理解力和运动的关系,知道物体的运动不需要力来维持。
第四章 语法分析 南京大学计算机系 戴新宇
第十二章 位运算.
坚持,努力,机会留给有准备的人 第一章 四大金融资产总结 主讲老师:陈嫣.
美丽的旋转.
第8章位运算 教学目的与要求: 1.熟练掌握六种位运算符及其使用方法 2.了解位段的使用方法.
第三章 植物的激素调节.
编译原理 第一章 编译程序概述 第二章 PL/0编译程序的实现 第三章 文法和语言 第四章 词法分析 第五章 自顶向下语法分析方法
第三章 流程控制 程序的运行流程 选择结构语句 循环结构语句 主讲:李祥 时间:2015年10月.
第二章 柯西不等式与排序不等式及其应用.
Presentation transcript:

编译原理与技术 课程总结

课程目录 第1章 概论 第2章 词法分析 第3章 语法分析 第4章 语法制导翻译生成中间代码 第5章 运行环境 第6章 代码生成

第1章 概论 编译与解释是语言翻译的两种基本形式 1.编译器:先翻译后执行,工作效率高,即时间快、空间省;交互性与动态特性差、可移植性差。大多数PL采用此种方法翻译; 2.解释器:边翻译边执行,工作效率低,即时间慢、空间费;交互性与动态特性好、可移植性好。早期的Basic和现在的Java等。

编译过程 1.编译器的工作过程: 词法分析、语法分析、语义分析 中间代码生成、代码优化 目标代码生成 符号表管理 出错处理 2.编译器的阶段

编译过程各阶段工作的归纳 <1> 词法分析:识别单词,至少分以下几大类:关键字、标识符、字面量、特殊符号; <2> 语法分析:得到语言结构并以树的形式表示; <3> 语义分析:考察结构正确的句子是否语义合法,可修改树结构; <4> 中间代码生成(可选):生成一种既接近目标语言,又与具体机器无关的表示,便于优化与代码生成; (编译器与解释器的以上工作阶段可以一致)

编译过程各阶段工作的归纳 <5> 中间代码优化(可选):局部优化、循环优化、全局优化等;实际上是一个等价变换,变换前后的指令序列完成同样的功能,而程序占用的空间和执行的时间都更省、更有效。 <6> 目标代码生成:不同形式的目标代码-汇编、可重定位、内存形式(Load-and-Go); <7> 符号表管理:合理组织符号,便于各阶段使用; <8> 出错处理:错误的种类-词法错、语法错、静态语义错、动态语义错。

编译器的分析/综合模式 1.前端:语言结构的分析 2.后端:语言意义的分析与处理 3.中间代码:前端与后端的分界

例题 1. 从程序运行的角度看,编译程序和解释程序的主要区别是 是否生成目标代码 。 1. 从程序运行的角度看,编译程序和解释程序的主要区别是 是否生成目标代码 。 2. 编译程序的基本组成有:词法分析、 、 、中间代码生成、代码优化、 、 和 ,其中,中间代码生成和代码优化是可选的;对表达式中运算数的类型检查一般在 阶段进行。 3. 编译程序是对________。 A. 汇编语言的翻译 B. 高级语言的解释执行 C. 机器语言的执行 D. 高级语言的翻译

第2章 词法分析 词法分析的两个重要环节: 规定所有合法输入+识别合法输入 要点: <1> 什么是正规式?什么是正规集? <2> 什么是有限状态自动机? <3> 如何利用Thomson算法从正则表达式构建NFA? 如何利用子集法从NFA得到DFA? 如何将一个DFA最小化?

第2章 词法分析 要点: <4> 为什么要进行词法分析? <5> 如何从描述设计出正规式? <6> 正则表达式、有限自动机、NFA、DFA与词法分析器的 关系?

疑难点 为什么要进行词法分析? 词法分析的第一个目的是将输入的程序文本中所有符号分类,使得接下来的语法分析可以在分析语法的过程中不再关心程序文本的细节。举例来说:C语言语句: int a; int b 显然是两个不同的语句,但是对语法分析而言,它们是相同的,其格式都是: 类型名 标识符 (对语法分析器而言,变量的名称没有意义)。词法分析器的作用就是将这些不同的部分先去除,只将语法分析需要关心的部分整理出来,留待语法分析器处理。 语法分析的第二个目的是初步整理出符号表的内容,并将其留给语义分析器处理。

疑难点 如何从描述设计出正规式? 正则表达式、有限自动机、NFA、DFA与词法分析器的关系 ? 从描述生成正规式没有任何现成的、形式化的方法,只能依靠经验。 正则表达式、有限自动机、NFA、DFA与词法分析器的关系 ? 正则表达式是一种描述字符串组成的规则。有限自动机可以看作是一种利用状态转换表示字符串匹配过程的算法。NFA和DFA则是有限自动机工作过程的图形化表示。其中NFA可以利用Thomson算法与正则表达式建立一一对应的关系。而词法分析器则是将DFA表示的算法用计算机程序实现后得到的程序。词法分析器中可以直接用无限循环和switch-case语句将自身的状态与DFA中的状态图实现一一对应。

例题 1. 词法分析的输出由 记号的种类 和 属性 两部分组成。 2. 指出NFA与DFA的主要区别。 1. 词法分析的输出由 记号的种类 和 属性 两部分组成。 2. 指出NFA与DFA的主要区别。 正规式0*(10*1)*0*所表示的语言是含有 偶数个1的0、1串 。 词法分析是编译的第一阶段,其主要任务是读取输入字符流(源程序),产生用于进行语法分析的的记号序列,同时过滤空白符号和注释。

例题 5.有正规式r=(a|b)*(aa|bb)(a|b)*,试给出: (1)r的正规集; (2)识别该正规集的DFA(要有步骤); 解: (1)L(r)是至少含有两个相连的a或两个相连的b的a、b串的集合。

例题 5.有正规式r=(a|b)*(aa|bb)(a|b)*,试给出: (2)识别该正规集的DFA(要有步骤); 解:(2)构造r的NFA如图1所示。 确定化:(NFA中没有ε状态转移,故仅需求smove) 初态:A={0} m(A,a)={0,1} B m(A,b)={0,2} C m(B,a)={0,1,3}D m(B,b)={0,2} C m(C,a)={0,1} B m(C,b)={0,2,3}E m(D,a)={0,1,3}D m(D,b)={0,2,3}E m(E,a)={0,1,3}D m(E,b)={0,2,3}E

例题 构造(a|b)*(aa|bb)(a|b)*的NFA如图1所示。 确定化:初态为A={0} m(A,a)={0,1} B m(A,b)={0,2} C m(B,a)={0,1,3}D m(B,b)={0,2} C m(C,a)={0,1} B m(C,b)={0,2,3}E m(D,a)={0,1,3}D m(D,b)={0,2,3}E m(E,a)={0,1,3}D m(E,b)={0,2,3}E 得DFA如图2所示。 图1 图2

例题 5.有正规式r=(a|b)*(aa|bb)(a|b)*,试给出: (3)最小化的DFA。 解:(3)初始划分:{ABC,DE} 因为B状态经a状态转移与AC不在同一组,故B被分出,形成新的划分:{AC,B,DE} 又因m(A,b)=C和m(C,b)=E不在同一组,所以最终划分:{A,B,C,DE} 得最小DFA如图3。 图3 图2

(a) 用自然语言简要叙述该自动机所识别的语言 的特点,列举两个它可识别的串。 (b) 写出与该自动机等价的正规式r。 例:已知一个NFA如图。 (a) 用自然语言简要叙述该自动机所识别的语言 的特点,列举两个它可识别的串。 (b) 写出与该自动机等价的正规式r。 (c) 用子集法构造识别r的最小DFA。 解: (a) 语言特点是包含子串“bb”的ab符号串。如abba、abbbab。 (b) r =(a|b)*bb(a|b)* (c) 关键步骤:确定化、最小化 1.确定化:子集法构造DFA(用状态矩阵表示)   a b A B C D   a b {0} A {0} A {0,1} B {0,1} B {0,1,2} C {0,1,2} C {0,2} D {0,2} D 得到DFA如右(其中,C和D中含NFA的终态,故C和D是DFA的终态)

原始划分(两个组):1={A,B} 2={C,D} 考察所有状态转移: move(A,a) = A, move(B,a) = B 2.最小化DFA:(利用可区分概念) 原始划分(两个组):1={A,B} 2={C,D} 考察所有状态转移: move(A,a) = A, move(B,a) = B move(A,b) = B, move(B,b) = C move(C,a) = D, move(D,a) = C move(C,b) = D, move(D,b) = C 根据可区分概念将1分割成两个组1和3,得到: 1={A} 2={C,D} 3={B} 由于状态C和D不可区分,因此可将C、D合并为一个状态且选C作代表,得到最小DFA如右。 对应的图形表示如下。   a b A B C D   a b A B C DFA NFA

第3章 语法分析 要点: <1> 什么是产生式?什么是上下文无关文法(CFG)? <2> 什么是文法的二义性和语言的二义性? 消除文法二义性的方法有哪些? <3> 什么是推导?最左推导?规范推导(最右推导)? <4> 什么是语法树?什么是分析树? <5> 自上而下语法分析与自下而上语法分析? <6> 如何消除左递归和直接左递归?如何提取左因子? <7> 如何计算FIRST和FOLLOW集? <8> 什么是递归下降分析?

第3章 语法分析 要点: <8> 如何构造预测分析表并进行预测分析? <9> 什么是短语、直接短语、句柄? <10> 如何构造SLR(1)分析表并进行“移进-归约”分析? <11> 什么是“移进-归约”和“归约-归约”冲突? <12> 为什么要进行语法分析? <13> 如何根据语言描述编写语法产生式? <14> 为什么自上而下分析不能有公共左因子和左递归? <15> 识别语言的自动机与文法的对应关系?

疑难点 为什么要进行语法分析? 语法分析是对程序文本(实际上是经过词法分析器处理过的,只保留了符号的类型的程序文本)进行合法性分析,其作用在于保证传递给语义分析器的程序符合编译器定义的编程语言的语法正确性要求,使语义分析器能够正确进行语义分析。

疑难点 自上而下分析和自下而上分析方式在分析的过程上有什么区别和联系? 自上而下分析过程实际上是一个“先展开,再匹配”的过程。它总是从开始符号开始,每一次都按照某一个产生式进行展开,并与现有的输入字符串比较。在这个展开过程中,就会产生一些可以与输入符号串的某个位置匹配的终结符,同时还会产生一些产生式中出现的非终结符。自上而下分析会反复匹配这个展开符号串中的非终结符,直到这个展开符号串中再也没有任何非终结符为止。如果这时得到的展开符号串与输入串的内容一致,则说明输入匹配成功。自上而下分析过程总是试图用某一个已知的产生式来“解释”(匹配)现在输入的状态,直到最终能够完全“解释”(匹配)输入符号串为止。

疑难点 自下而上分析过程实际上是一个“先读入,再归纳(归约)”的过程。自下而上分析过程一开始实际上程序并不知道自己将得到什么样的产生式,它只是不停地先读入字符并将其存储在一个堆栈之中,并依照某种标准(就是“移进-归约”分析表)来判断堆栈之中这些已经读入的终结符和非终结符是否可以归约成某个产生式。如果可以,它就将可以归约的部分归约成一个新的非终结符,并用它替换原来堆栈中归约出它来的那一部分(表示这一部分已经可以用这个新的非终结符代表)。如此不停分析下去,如果最终我们可以将这整个输入符号串归约成文法开始符号,就认为匹配成功。自下而上分析过程可以试图用产生式“化简”(归约)读入的符号,直到最后可以“化简”出文法开始符号为止。

疑难点 FIRST和FOLLOW集在语法分析过程中起到的作用是什么?

疑难点 自上而下分析和自下而上分析与FIRST、FOLLOW集的关系是什么? 自上而下分析过程中实际上主要依赖FIRST集合,因为自上而下分析的基本手段是“看到一个字符来决定现在应该是哪个产生式的开始”。相反的,自下而上分析则主要依赖FOLLOW集合,因为自下而上分析的方法是现不停移进,并依照“下一个字符是什么”来决定自己移进的是不是已经能够形成一个完整的产生式。在这个过程中,FOLLOW集合就是“遇到什么终结符表示我们可以归约这个产生式”的依据。 但是,FIRST和FOLLOW集合必须一同使用,因为FOLLOW集合的计算必须建立在FIRST集合的基础之上。

疑难点 为什么自上而下分析不能有公共左因子和左递归? 自上而下分析不能有公共左因子的原因在于自上而下分析是依靠当前看到的第一个终结符来决定现在的格局应该按照什么产生式进行展开的。如果用于推导出同一个非终结符的不同产生式拥有相同的左因子,则自上而下分析过程就不知道应该按哪个产生式作为展开的依据,从而无法分析下去。如果使用预测分析方法分析带有公共左因子的文法,最明显的表现就在于在预测分析表中的某个表格中会出现必须填写多个产生式的情况,

疑难点 为什么自上而下分析不能有公共左因子和左递归? 自上而下分析不能有左递归的原因则在于:自上而下分析总是按照从左到右的方式分析输入的。因此,自上而下分析的方式总是要求每一次展开都能“消去”产生式最左端的一部分终结符,只有这样才能保证每一次展开都能够使剩下未匹配的部分变“短”一些,最终做到完全匹配。如果产生式最左端出现左递归,则每一次展开的最左边都不可能产生可以消去的终结符,那么程序将永远无法继续分析下去。值得注意的是,所谓的左递归不但包括可以看到的直接左递归,还包括经过推导能够从文法中推导出来的间接左递归。

疑难点 为什么自下而上分析会出现“移进-归约”和“归约-归约”冲突? 因为自下而上分析总是根据下一个终结符归属于哪一个非终结符的FOLLOW集合来确定已经移进的符号将按照哪个产生式归约。如果某一个终结符同时属于两个非终结符的FOLLOW集合,则分析器就无法确定应该按照哪个非终结符进行归约。这时就会产生“归约-归约”冲突。

疑难点 为什么自下而上分析会出现“移进-归约”和“归约-归约”冲突? “移进-归约”冲突的产生则是由于LR(0)项目集合中可能出现这样的一种情况: A → X. B → X.tY 其中,t是终结符,A、B、X、Y是非终结符,且t是A的FOLLOW集合中的一个成员。 在以上情形之下:产生式A的右部正好是产生式B的右部的前缀,而且B中在与A相同的前缀后紧跟的又是FOLLOW(A)中的终结符。当产生式归约了X后,如果输入串的下一个字符是t,则分析器就无法确定应该是归约还是移进,因为两种操作按照文法来看都是合理的。但如果t没有在FOLLOW(A)中出现,则不构成冲突。

例题 对单词的识别,是依据 词法(构词) 规则进行的,对句子的识别,是依据 语法 规则进行的。 对单词的识别,是依据 词法(构词) 规则进行的,对句子的识别,是依据 语法 规则进行的。 2型文法是 上下文无关文法 ,对应的分析器是 下推 自动机;3型文法是 正规文法 ,对应的分析器是 有限 自动机。 文法的终结符集和 非终结符集 的交集一定为 空 。词法分析器交给语法分析器的文法符号一定是 终结符 ,它只能出现在产生式的 右 部。 LL(1)分析法中,第一个L的含义是 自左向右扫描输入 ,第二个L的含义是最左推导 ,1的含义是确定下一个动作向前看1个终结符 。

例题 最右推导(或规范推导) 是与规范归约(最左归约)互逆的一个过程,规范归约每次归约的符号串称为 句柄 。 最右推导(或规范推导) 是与规范归约(最左归约)互逆的一个过程,规范归约每次归约的符号串称为 句柄 。 自上而下分析的一般方法是:对于任何一个输入序列,从 文法开始符号 开始,进行最左推导,反复用产生式 右部的文法符号序列 替换句型中的 非终结符 ,最终得到 一个句子(终结符序列) 。 用LR方法实现语法分析时,典型的操作有 移进 、归约 、接受和报错。 一个文法产生的 句子的集合 称为该文法产生的语言。 递归下降分析法是一种自上而下的语法分析方法。

例题 在自上而下的语法分析方法中,应对文法实施以下改造: 消除左递归 以避免分析陷入死循环,提取公共左因子以避免回溯。 在自上而下的语法分析方法中,应对文法实施以下改造: 消除左递归 以避免分析陷入死循环,提取公共左因子以避免回溯。 给定文法A→bA|cc,下面的符号串中,为该文法句子的是 A 。 A. cc B. bcbc C. bccbcc D. ccb 3.已知文法G:S→A0 A→A0|S1|1。与G等价的正规式是C 。 A. (0|1)*0 B. 0*|1*0 C.1(0|01)*0 D. (10|01)*0

例题 4. 设有文法G:S→aBc|bAB, A→aAb|b, B→b|ε。 <1> 计算非终结符S、A、B的FIRST和FOLLOW集合; <2> 构造G的LL(1)分析表; <3> 分析输入序列baabbb(以格局的形式写出具体的分析步骤)。 5. 设有文法G:S→S(S), S→ε。 <1> 构造识别G的活前缀的DFA; <2> G是LR(0)的吗?请说明理由; <3> G是SLR(1)的吗? 若是构造出它的SLR分析表;若不是请说明理由。

4. 设有文法G:S→aBc|bAB, A→aAb|b, B→b|ε。 <1> 计算非终结符S、A、B的FIRST和FOLLOW集合; <2> 构造G的LL(1)分析表; <3> 分析输入序列baabbb(以格局的形式写出具体的分析步骤)。 解:<1> 计算FIRST和FOLLOW: FIRST(B)={b,ε} FIRST(A)={a, b} FIRST(S)={a, b} FOLLOW(B)={c,#} FOLLOW(A)={b,#} FOLLOW(S)={#} <2> 构造预测分析表: a b c # S aBc bAB A aAb B ε

<3> 分析输入序列baabbb 栈 剩余输入 产生式 #S baabbb# S→bAB #BAb #BA aabbb# A→aAb #BbAa #BbA abbb# #BbbAa #BbbA bbb# A→b #Bbbb #Bbb bb# #Bb b# #B # B→ε

例题 5. 设有文法G:S→S(S), S→ε。 <1> 构造识别G的活前缀的DFA; <2> G是LR(0)的吗?请说明理由; <3> G是SLR(1)的吗? 若是构造出它的SLR分析表;若不是请说明理由。 解:<1> 构造识别G的活前缀的DFA :

例题 解:<1> 构造识别G的活前缀的DFA : <2> G是LR(0)的吗?请说明理由; 此文法不是LR(0)文法,因为在I1、I2中有移进/归约冲突(如果仅考虑终结符,应该没有移进/归约冲突);

<3> G是SLR(1)的吗? 若是构造出它的SLR分析表;若不是请说明理由。 解:计算FOLLOW(S)={(, ), #},∵{(, ), #}∩{S}=Φ ∴ I1、I2中的移进/归约冲突可通过简单向前看一个符号解决,此文法是SLR(1)文法,它的分析表如下: 状态 ACTION GOTO ( ) # S r2 1 s2 acc 2 3 s4 4 r1

第4章 语法制导翻译生成中间代码 要点: <1> 程序的语法和语义,语义信息用文法符号的属性。 <2> 什么是语法制导翻译? <3> 为什么生成中间代码?常见中间代码的形式有哪些? <4> 符号表的作用和内容? <5> 声明语句的翻译 <6> 可执行语句的翻译

第4章 语法制导翻译生成中间代码 要点: <5> 声明语句的翻译 定义与声明: 类型定义与变量声明,过程定义与声明 变量声明:填写符号表 过程声明: 左值和右值 四种过程调用时参数传递方式 名字的作用域:静态作用域原则和最近嵌套原则 声明中作用域信息的保存

第4章 语法制导翻译生成中间代码 要点: <6> 可执行语句的翻译 算术表达式和赋值语句的翻译 数组元素引用 布尔表达式短路计算方式的翻译: 真出口与假出口、真值链与假值链 控制语句的翻译:拉链-回填

疑难点 为什么要进行语义分析? 语义分析是编译器中真正分析输入程序含义的部分。它根据一组定义好的规则(语法制导定义)检查已经由语法分析部分分析完毕的、没有语法错误的程序,并将其按照一定的规则(翻译方案)生成我们想要的结果(如果是解释器,就直接解释执行;如果是编译器,则通常将其翻译成功能等价的汇编语言或其他高级语言程序)。

疑难点 中间代码在分析方案中起到的作用是什么? 中间代码为语义分析程序定义了一种标准的形式,如果语义分析程序需要生成不同的目标语言代码,只要更改中间代码到目标代码翻译模块就可以达到目的,语义分析部分可以不必改动。

疑难点 符号表在语法制导翻译过程中的作用是什么? 符号表存储了程序中所有变量、常量或过程的名字(标识符)。在最终生成的代码中,这些名字都将被转换成对应的地址(变量和常量是存储地址,而过程则是入口地址),而这一部分工作主要就是在语法制导翻译的过程中完成的,符号表在这一过程中的作用有两个:1、允许翻译程序快速地检索某一个标识符对应数据或过程的信息;2、提供一个正确的作用域管理机制,使得翻译程序能够正确访问到它当前应该访问到的地址(例如,重名的局部变量和全局变量)。

疑难点 为什么需要进行计算数组下标映射 ? 数组就是一块用于存储数据的固定大小的内存。由于现代计算机内部的内存都是按照一维线性结构排列的,所以现代的计算机实际上无法实现真正意义上的多维数组,必须使用一维数组来模拟。如果程序需要提供多维数组的机制,就必须设法把多维数组的多维下标映射成为一维的下标,才能做到正常访问。

疑难点 “拉链-回填”分析方法的作用是什么?用在何处? “拉链-回填”主要用于这样一种情况:在生成代码的过程中,有时需要生成一些跳转到另一个过程首地址的程序语句,但是这个目的地地址必须在后面的代码中生成,当前还没有确定。于是我们必须将要填入这个还未生成的地址的位置记录下来,留待当这个目的地地址生成之后再回头补上,就是所谓的“回填”。如果这个跳转地址在它定义之前被引用的次数有许多次,那么这些引用的位置通常用一个链表的形式记录下来(因为不能确定这个地址要被引用多少次,用链表处理比较方便),这就是所谓的“拉链”。

例题 中间代码的主要形式有 后缀式 、 三地址码 和 树(或图) 。 与后缀式abc*+-d/对应的表达式是 -(a+b*c)/d 。 中间代码的特点是什么?采用中间代码有什么好处? 答:中间代码的特点是与具体机器(指令系统)无关;采用中间代码可以明确区分前端与后端;便于优化和移植。

例题 语义错误可分为静态语义错误和动态语义错误,“运算符与运算对象的类型不一致”属于 静态语义 错误,“无穷递归”属于 动态语义 错误。 语义错误可分为静态语义错误和动态语义错误,“运算符与运算对象的类型不一致”属于 静态语义 错误,“无穷递归”属于 动态语义 错误。 过程(或函数)调用中, 引用 调用传递给形参的是实参的左值, 值 调用传递给形参的是实参的右值,复写/恢复调用传递给形参的是实参的 右 值。

例题 数组元素的地址计算公式由两部分组成,一部分是不变部分,它在 编译 时确定;另一部分是可变部分,它在 运行 时确定。 为数组声明a:array[1..3, 2..4]中a分配的存储空间的首地址为base_a,且每个数组元素占据一个存储单元。若以行为主存放,数组元素a[3, 3]在存储空间中相对base_a的偏移量是 7 ;若以列为主存放,数组元素a[3, 3]在存储空间中相对base_a的偏移量是 5 。

例题 3. 对下述C++程序,(a) 指出p1和p2分别采用什么样的参数传递方式; (b)给出程序的执行结果。 void p1(int a, int b, int c) {c=c+10; b=a*b+c;} void p2(int &a, int &b, int &c){c=c+10; b=a*b+c;} void main() { int x=80, y=20, z=0, t=0; z=x+y*90; p1(x+y,x,z); cout << "p1结果=" << x << endl; t=x+y; p2(t,x,z); cout << "p2结果=" << x << endl; }

例题 解: (a) 指出p1和p2分别采用什么样的参数传递方式; p1采用值调用,p2采用引用调用 (b) 给出程序的执行结果。

例题 4.有文法G如下(注:G中终结符id仅由单个英文字母组成,如a, b等):E→E*T|T T→T+F|F F→ (E)|id E→E1*T {E.place=newtemp; emit(*,E1.place,T.place,E.place;} | T {E.place=T.place;} T→T1+F {T.place=newtemp; emit(+,T1.place,F.place,T.place;} | F {T.place=F.place;} F→ (E) {F.place=E.place;} | id {F.place=id.name;} (a) 求句型(T+F)*id 的短语、直接短语以及句柄; (b) 根据语法制导翻译写出句子a*b+c*d的中间代码; (c) 若a=3,b=5,c=7,d=8,请给出中间代码计算结果; (d) 将文法G简化为:E→E*T|T,T→T+F|F,F→id。给出它的识别活前缀的DFA。

解:(无论是求短语还是计算值,首先应该给出它们的分析树,因为分析树是分析过程和句子结构的最直观表示) (a) 短语:T+F,(T+F),id,(T+F)*id 直短:T+F,id,句柄 :T+F (b)句子a*b+c*d的四元式组: (1) (+, b, c, t1) (2) (*, a, t1, t2) (3) (*, t2, d, t3) (c) 将a=3,b=5,c=7,d=8 代入四元式组, 得计算结果:288 (T+F)*id 的分析树 a*b+c*d的分析树

(d) E→E*T|T,T→T+F|F,F→id的识别活前缀的DFA:

例题 1. 程序代码如下 if (b>0) then while (a>b) do a:=a-1 else a:=a+b; (1)请画出它的代码结构图(程序流程图); (2)给出其三地址码序列。 解: 1: if b>0 goto 3 2: goto 8 3: if a>b goto 5 4: goto 10 5: t1:=a-1 6: a:=t1 7: goto 3 8: t2:=a+b 9: a:=t2 10:

(也可以先给出语句的分析树,然后剪句柄生成中间代码) 2. 给出语句while (a<b) do if (c<d) then x:= y+z的中间代码序列。 解:程序流程图: 中间代码: 101 (j<, a, b, 103) 102 (j, -, -, 108) 103 (j<, c, d, 105) 104 (j, -, -, 101) 105 (+, y, z, t1) 106 (:=, t1, -, x) 107 (j, -, -, 101) 108 ... 或: 101 if a<b goto 103 102 goto 108 103 if c<d goto 105 104 goto 101 105 t1 := y+z 106 x := t1 107 goto 101 108 ... (也可以先给出语句的分析树,然后剪句柄生成中间代码)

第5章 运行环境 要点: <1> 什么是活动? 什么是活动树? <2> 什么是活动记录? <3> 控制栈的作用是什么? <4> 内存空间(数据空间)的存储分配策略有哪些? <5> 什么是调用序列和返回序列? <6> 栈分配方式 控制栈中活动记录的具体内容,指针top和sp 控制链和访问链 非本地数据的访问:访问链方式、显示表方式

例题 常用的存储分配策略有 静态 分配、 栈 分配和 堆 分配。 静态 数据区用于存放一对一的绑定、且编译时就可确定存储空间大小的数据; 栈 用于存放一对多的绑定且与活动同生存期的数据。 过程的嵌套层次树反映了 过程之间的嵌套 的关系;活动的活动树反映了顺序执行程序的 活动的调用 关系。

例题 简述活动记录和访问链的主要作用,以及访问链的指向。 答:活动记录用于提供活动所需的环境,访问链用于访问非本地数据。访问链的指向有两种:非显示表指向直接外层的最新活动记录,显示表指向同层次新活动记录。

例题 5. 设有一程序在执行到某一时刻时,控制栈中的活动记录如下图所示(其中A是主程序,B、C、D、E均是过程)。 访问链 控制链 给出所有在活动期的活动的调用关系(提示:若A调用B,则记为A→B); 解:所有在活动期的活动的调用关系:A→B→D→E→B→C;

例题 设有一程序在执行到某一时刻时,控制栈中的活动记录如下图所示(其中A是主程序,B、C、D、E均是过程)。 控制链 访问链 (b) 分别指出A、B、C、D、E的嵌套深度; (c)试根据访问链中的内容画出过程的嵌套关系树。 解: A、B、C、D、E的嵌套深度分别为: 1、2、3、3、2;

6. 有C++程序如下所示: #include <iostream.h> int f(int n) { if (n<2) return n; return f(n-1)+f(n-2); } void main(){ int a=4; cout<<f(a)<<endl;} (a) 画出程序运行时的活动树; (b) 给出程序的运行结果; (c) 若控制栈从左向右增长(最右边是栈顶),请问(main, f(4), f(1))是不是一个可能的控制栈状态?为什么?

解: (a) 活动树如下: (b) 程序的运行结果为:3 (c) 不是一个可能的控制栈状态,因为f(4)不能直接调用f(1)。从活动树也可以看出,在f(4)所在的任何一条路径上,f(4)和f(1)不相邻。

结 束