第六章中间代码生成赵建华南京大学计算机系.

Slides:

Advertisements

Similar presentations

人的性别遗传合肥市第四十九中学丁艳. 男女成对染色体排序图 1 、男性和女性各 23 对染色体有何异同 ? 哪一对被称为性染色体 ? 2 、这两幅图中，哪幅图显示的是男性的染色体？哪幅图显示的是女性染色体？ 3 、图中哪条染色体是 Y 染色体？它与 X 染色体在形态上的主要区别是.

Advertisements

痹证河南中医学院第一临床医学院中医内科张琳琪. 内容提要概说 1 病因病机 2 诊查要点 3 辨证论治 4 预防调护 5 临证备要 6 结语 7.

XX啤酒营销及广告策略.

1、一般地说，在生物的体细胞中，和都是成对存在的。

辨性别 A B. 辨性别 A B 第三节人类染色体与性别决定昌邑市龙池初中杨伟红学习目标 1．理解人的染色体组成和传递规律。 2．解释人类性别决定的原理。 3．通过探究活动，解读数据了解生男生女的比例。

第五章语法制导的翻译赵建华南京大学计算机系 2010年3月.

编译原理第二次习题课王静.

第四章控制结构.

C#程序设计案例教程第3章程序结构.

忠孝國小自立午餐老師的叮嚀教師指導手冊.

清仓处理跳楼价满200返160 5折酬宾.

上課囉職場甘苦談小資男孩向錢衝育碁數位科技呂宗益/副理.

命题的四种形式高二数学.

1.1.2 四种命题.

第 5 章流程控制 (一)：條件分支.

色弱與色盲.

第五章定积分及其应用.

宠物之家我的宠物性别？雌（♀） or 雄（♂）第一阶段：我的宠物我做主第二阶段：宠物“相亲记” 第三阶段：家族诞生

课标教材下教研工作的实践与思考山东临沂市教育科学研究中心郭允远.

北师大版七年级数学 5.5 应用一元一次方程 ——“希望工程”义演枣庄市第三十四中学曹馨.

专题研讨课二：数组在解决复杂问题中的作用

海洋存亡匹夫有责 ——让我们都来做环保小卫士 XX小学三（3）班.

第三章控制结构.

编译原理与技术中间代码生成 2018/9/17 《编译原理与技术》讲义.

7 Intermediate Representation

陳維魁博士儒林圖書公司第七章參數的傳遞陳維魁博士儒林圖書公司.

C++Primer 3rd edition 中文版 Chap 5

编译原理与技术第7章中间代码生成 3学时.

编译原理与技术类型检查 2018/11/21 《编译原理与技术》－类型检查.

程式敘述執行順序的轉移控制與重複、方法 Lecturer：曾學文.

第3章語法入門第一個Java程式文字模式下與程式互動資料、運算流程控制.

C++语言程序设计 C++语言程序设计第六章指针和引用第十一组 C++语言程序设计.

6 下标变量的中间代码生成下标:数组；变量：下标变量：即数组分量：简单变量：id，其地址可查到；

C 語言簡介 - 2.

数学3（必修）—— 算法 ALGORITHM 苏州大学数学科学学院徐稼红

條件判斷指令 -if 指令 -switch 指令迴圈指令 - for 迴圈 - while迴圈 - break、continue 指令

第2次课上下文无关文法

7.4 布尔表达式和控制流语句布尔表达式有两个基本目的计算逻辑值 c = (a > b) && a > 1

程序的三种基本结构 if条件分支语句 switch多路开关语句循环语句循环嵌套 break，continue和goto语句

中间代码生成.

陳維魁博士儒林圖書公司第五章控制結構陳維魁博士儒林圖書公司.

计算机算法设计与分析（第3版）王晓东编著电子工业出版社.

导数的应用 ——函数的单调性与极值.

第九章目标代码生成.

第二章Java基本程序设计.

第三课标识符、关键字、数据类型.

C语言概述第一章.

第1讲 C语言基础要求: (1) C程序的组成 (2) C语言的标识符是如何定义的。 (3) C语言有哪些基本数据类型？各种基本数

第六章语法制导的翻译本章内容介绍一种语义描述方法：语法制导的翻译，介绍语法制导的翻译的实现方法。

第二章、第三章错题分析.

陳維魁博士儒林圖書公司第三章變數與繫結陳維魁博士儒林圖書公司.

第二章 Java基本语法讲师：复凡.

第3 语言翻译问题 [学习目标]：学习和掌握语言的语法的基本概念和基本要素，理解翻译的步骤；学习和掌握BNF文法。

第十四章若干深入问题和C独有的特性作业: 函数指针函数作参数函数副作用运算语句位段存储类别编译预处理

第十讲基于格理论的数据流分析.

C++语言程序设计教程第2章数据类型与表达式第2章数据类型与表达式制作人：杨进才沈显君.

习题课编译原理与技术计算机科学与技术学院李诚.

第二章 Java语法基础.

第二章 Java基本语法讲师：复凡.

两个变量的线性相关琼海市嘉积中学梅小青.

第1章数据结构基础概论本章主要介绍以下内容数据结构研究的主要内容数据结构中涉及的基本概念算法的概念、描述方法以及评价标准.

Do While 迴圈東海大學物理系‧資訊教育施奇廷.

PPT注意事项: 当前PPT课件文件必须和提供的源代码文件夹“代码”在同一目录中即不要移动文件夹“代码”的默认位置。

第2章 Java语言基础.

第6章 PHP基本語法介紹.

判斷(選擇性敘述) if if else else if 條件運算子.

第三章流程控制程序的运行流程选择结构语句循环结构语句主讲：李祥时间：2015年10月.

第二章 Java基础语法北京传智播客教育

第二章 Java基本语法讲师：复凡.

Presentation transcript:

第六章中间代码生成赵建华南京大学计算机系

本章内容中间代码表示静态类型检查中间代码生成抽象语法树三地址代码：x=y op z 类型检查（type checking）语法分析之后的抽象语法(syntax)检查，比如break的位置，goto的目标…. 中间代码生成

编译器前端的逻辑结构

三地址代码（1）每条指令右侧最多有一个运算符允许的运算分量：一般情况可以写成x = y op z 名字：源程序中的名字作为三地址代码的地址常量：源程序中出现或生成的常量编译器生成的临时变量

三地址代码（2）指令集合（1）运算/赋值指令：x=y op z x = op y 复制指令：x=y 无条件转移指令：goto L 条件转移指令：if x goto L if False x goto L 条件转移指令：if x relop y goto L

三地址代码（3）指令集合（2）过程调用/返回：带下标的复制指令：x=y[i] x[i]=y 地址/指针赋值指令： param x1 //设置参数 param x2 … param xn call p, n //调用子过程p，n为参数个数带下标的复制指令：x=y[i] x[i]=y 注意：i表示离开数组位置第i个字节，而不是数组的第i个元素地址/指针赋值指令： x=&y x=*y *x=y

例子语句 do i = i + 1; while (a[i]<v)；

三地址指令的四元式表示方法在实现时，可以使用四元式/三元式/间接三元式来表示三地址指令四元式：可以实现为纪录（或结构）格式（字段）： op arg1 arg2 result op: 运算符的内部编码 arg1,arg2,result是地址 x=y+z + y z x 单目运算符不使用arg2 param运算不使用arg2和result 条件转移/非条件转移将目标标号放在result字段

四元式的例子赋值语句：a=b* -c + b* -c

三元式表示三元式（triple） op arg1 arg2 使用三元式的位置来引用三元式的运算结果 x[i]=y需要拆分为两个三元式 x=y op z需要拆分为（这里？是编号） (?) op y z = x ? 问题：在优化时经常需要移动/删除/添加三元式，导致三元式的移动。

三元式的例子 a=b*-c + b * -c

间接三元式包含了一个指向三元式的指针的列表我们可以对这个列表进行操作，完成优化功能；操作时不需要修改三元式中的参数。

静态单赋值（SSA） SSA中的所有赋值都是针对不同名的变量对于同一个变量在不同路径中定值的情况，可以使用φ函数来合并不同的定值 if (flag) x=-1; else x = 1; y = x*a if (flag) x1=-1; else x2 = 1; x3=φ(x1,x2)； y = x3*a

类型和声明类型检查(Type Checking) 类型信息的用途本节的内容利用一组规则来检查运算分量的类型和运算符的预期类型是否匹配。查错、确定名字需要的内存空间、计算数组元素的地址、类型转换、选择正确的运算符本节的内容确定名字的类型，变量的存储空间布局（相对地址）

类型表达式类型表达式（type expression）：表示类型的结构基本类型类名类型构造算子作用于类型 array[数字，类型表达式] record[字段/类型对的列表]（可以用符号表表示）函数类型构造算子：参数类型结果类型笛卡尔积：s X t 可以包含取值为类型表达式的变量

类型表达式的例子类型例子类型表达式元素个数为3X4的二维数组数组的元素的记录类型该记录类型中包含两个字段: x和y,其类型分别是float和integer 类型表达式 array[3, array[4,record[(x,float),(y,float)]]

类型等价不同的语言有不同的类型等价的定义结构等价名等价或者它们是相同的基本类型或者是相同的构造算子作用于结构等价的类型而得到的。或者一个类型是另一个类型表达式的名字名等价类型名仅仅代表其自身

声明文法含义： D  T id ; D | ε T  B C | record ‘{’ D ‘}’ C  int | float C  ε | [num] C 含义： D生成一系列声明； T生成不同的类型； B生成基本类型int/float； C表示分量，生成[num]序列；注意record中包含了各个字段的声明。字段声明和变量声明的文法一致。

局部变量的存储布局变量的类型可以确定变量需要的内存函数的局部变量总是分配在连续的区间；变量的类型信息保存在符号表中；即类型的宽度可变大小的数据结构只需要考虑指针函数的局部变量总是分配在连续的区间；因此给每个变量分配一个相对于这个区间开始处的相对地址变量的类型信息保存在符号表中；

计算T的类型和宽度的SDT 综合属性：type, width 全局变量t和w用于将类型和宽度信息从B传递到C ε 相当于C的继承属性，因为总是通过拷贝来传递，所以在SDT中只赋值一次。也可以把t和w替换为C.t和C.w

SDT运行的例子输入：int[2][3]

作用域和符号表在具有语句块概念的编程语言中，标识符x在最内层的x声明的作用域中。每个作用域对应于一个符号表；多个符号表形成树状结构。在语义分析时，通过栈来存放当前符号表及其祖先。

声明序列的SDT（1）在处理一个过程/函数时，局部变量应该放到单独的符号表中去；这些变量的内存布局独立 SDT的处理方法相对地址从0开始；假设变量的放置和声明的顺序相同； SDT的处理方法变量offset记录当前可用的相对地址；每“分配”一个变量，offset的值增加相应的值 top.put(id.lexeme, T.type, offset) 在当前符号表(位于栈顶)中创建符号表条目，记录标识符的类型，偏移量

声明序列的SDT（2）我们可以把offset看作D的继承属性 D.offset表示D中第一个变量的相对地址 P{D.offset =0} D D T id; {D1.offset = D.offset + T.width;} D1

记录字段的处理 Trecord ‘{‘ D ‘}’ 为每个记录创建单独的符号表首先创建一个新的符号表，压到栈顶；

表达式代码的SDD 将表达式翻译成三地址指令序列表达式的SDD 属性code表示代码 addr表示存放表达式结果的地址（临时变量） new Temp()可以生成一个临时变量 gen(…)生成一个指令

增量式翻译方案主属性code满足增量式翻译的条件。注意： top.get(…)从栈顶符号表开始，逐个向下寻找id的信息。这里的gen发出相应的代码

数组元素的寻址假设数组元素被存放在连续的存储空间中。元素从0到n-1编号，第i个元素的地址为 base+i*w K维数组的寻址：假设数组按行存放，即首先存放A[0][i2]…[ik]，然后存放A[1][i2]…[ik]，… A[i1][i2]…[ik]的地址 base+i1*w1+i2*w2+…+ik*wk 或者 base+((…((i1*n2+i2)*n3+i3)…)*nk+ik)*w 其中：base、w、i、n的值可以从符号表中找到。

新的文法产生式数组元素L：LL[E] | id[E] 以数组元素为左部的赋值：SL=E; 数组元素作为表达式中的因子：EL L的代码计算偏移量，将结果存放于L.addr所指的临时变量中综合属性array记录了相应数组的信息：元素类型，基地址，…

数组元素作为因子 L的代码只计算了偏移量；数组元素的存放地址应该根据偏移量进一步计算，即L的数组基址加上偏移量使用三地址指令x=a[i]

数组元素作为赋值左部使用三地址指令a[i]=x

例子表达式：c+a[i][j]

类型检查和转换类型系统：可发现错误、提高代码效率、确定临时变量的大小、… 给每一个组成部分赋予一个类型表达式通过一组逻辑规则来表示这些类型表达式必须满足的条件可发现错误、提高代码效率、确定临时变量的大小、…

类型系统的分类类型综合类型推导根据子表达式的类型构造出表达式的类型根据语言结构的使用方式来确定该结构的类型： if f 的类型为st且x的类型为s then f(x)的类型为t 类型推导根据语言结构的使用方式来确定该结构的类型： if f(x)是一个表达式 then 对于某些类型α,β；f的类型为αβ且x的类型为α

类型转换假设在表达式x*i中，x为浮点数、i为整数，则结果应该是浮点数类型转换比较简单时的SDD： x和i使用不同的二进制表示方式浮点*和整数*使用不同的指令 t1 = (float) i t2 = x fmul t1 类型转换比较简单时的SDD： EE1 + E2 { if(E1.type = integer and E2.type = integer) E.type = integer; else if (E1.type = float and E2.type= integer) E.type = float;} } 这个规则没有考虑生成类型转换代码

类型的widening和narrowing Java的类型转换规则编译器自动完成的转换为隐式转换，程序员用代码指定的转换为显式转换。

处理类型转换的SDT 函数Max求的是两个参数在拓宽层次结构中的最小公共祖先 Widen函数已经生成了必要的类型转换代码

函数/运算符的重载通过查看参数来解决函数重载问题 Ef(E1) { if f.typeset = {siti|1<= i<= k} and E1.type=sk then E.type = tk }

控制流的翻译布尔表达式可以用于改变控制流/计算逻辑值。文法语义短路代码 B  B‖B | B && B | !B | (B) | E rel E | true | false 语义 B1‖B2中B1为真时，不计算B2，整个表达式为真。因此，当B1为真时应该跳过B2的代码。 B1&&B2中B1为假时，不计算B2，整个表达式为假短路代码通过跳转指令实现控制流的处理逻辑运算符本身不在代码中出现；

短路代码的例子语句：代码 if (x<100 || x>200 && x!= y) x = 0; if x < 100 goto L2 ifFalse x > 200 goto L1 ifFalse x != y goto L1 L2: x=0 L1: 接下来的代码注：当x<100为真时，直接执行x=0；所以执行x>200时，x<100必然为假同理：计算x!=y时，x<100为假，而x>200为真

控制流语句的翻译文法：B表示布尔表达式，S代表语句代码的布局见右图继承属性 S if (B) S1 S if (B) S1 else S2 Swhile (B) S1 代码的布局见右图继承属性 B.true：B为真的跳转目标 B.false：B为假的跳转目标 S.next：S执行完毕时的跳转目标

语法制导的定义（1）

语法制导的定义（2）增量式生成代码： S while ( {begin = newlabel(); B.true = newlabel; B.false = S.next; gen(begin ‘:’)} B ) {gen(B.true ‘:’);S1.next=begin;}S1{gen(‘goto’ begin);}

布尔表达式的控制流翻译生成的代码执行时跳转到两个标号之一。 B.true和B.false是两个继承属性，根据B所在的上下文指向不同的位置如果B是if语句的条件表达式，分别指向then分支和else分支；如果没有else分支，则指向if语句的下一条指令如果B是while语句的条件表达式，分别指向循环体的开头和循环出口处；

布尔表达式的代码的SDD（1）

布尔表达式的代码的SDD（2）

布尔表达式代码的例子 if (x<100 || x > 200 && x!= y ) x = 0; 的代码

布尔值和跳转代码程序中出现布尔表达式的目的可能就是求出它的值。比如x=a<b；处理方法：文法：根据E的语法树结点所在的位置：首先建立表达式的语法树，然后根据表达式的不同角色来处理。文法： S  id = E; | if (E) S | while (E) S | S S E E‖E | E && E | E rel E | … 根据E的语法树结点所在的位置： Swhile ( E ) S1中的E，生成跳转代码对于Sid = E，生成计算右值的代码

回填（1）为布尔表达式和控制流语句生成目标代码的关键问题：某些跳转指令应该跳转到哪里例如：if (B) S 如何一趟处理完毕呢？按照短路代码的翻译方法，B的代码中有一些跳转指令在B为假时执行，这些跳转指令的目标应该跳过S对应的代码。生成这些指令时，S的代码尚未生成，因此目标不确定通过语句的继承属性next来传递。需要第二趟处理。如何一趟处理完毕呢？

回填（2）基本思想：记录B的代码中跳转指令goto S.next，if … goto S.next的位置，但是不生成跳转目标。这些位置被记录到B的综合属性B.falseList中；当S.next的值已知时（即S的代码生成完毕时），把B.nextList中的所有指令的目标都填上这个值。回填技术：生成跳转指令时暂时不指定跳转目标标号，而是使用列表记录这些不完整的指令；等知道正确的目标时再填写目标标号；每个列表中的指令都指向同一个目标

布尔表达式的回填翻译（1）布尔表达式用于语句的控制流时，它总是在取值true时和取值false时分别跳转到某个位置引入两个综合属性 truelist: 包含跳转指令（位置）的列表，这些指令在取值true时执行 falselist：包含跳转指令（位置）的列表，这些指令在取值false时执行辅助函数 Makelist(i) Merge(p1,p2) Backpatch(p,i)

布尔表达式的回填翻译（2）

回填和非回填方法的比较（1） true/false属性的赋值，在回填方案中对应为相应的list的赋值或者merge； B  {B1.true=B.true, B1.false = newlabel();} B1 || {label(B1.false); B2.true = B.true; B2.false=B.false;} B2 true/false属性的赋值，在回填方案中对应为相应的list的赋值或者merge；原来生成label的地方，在回填方案中使用M来记录相应的代码位置。M.inst的需要对英语相应label的标号；原方案生成的指令goto B1.false，现在生成了goto M.inst

回填和非回填方法的比较（2）回填时生成指令坯，然后加入相应的list 原来跳转到B.true的指令，现在被加入到B.truelist中。

布尔表达式的回填例子 x<100 || x>200 && x!=y

控制转移语句的回填 S if ( B ) S | if (B) S else S | while (B) S | { L } | A L  L S | S 语句的综合属性：nextlist nextlist中的跳转指令的目标应该是S执行完毕之后紧接着执行的下一条指令的位置。考虑S是while语句、if语句的子语句时，分别应该跳转到哪里？

控制转移语句的回填（2） M的作用就是用M.instr记录下一个指令的位置规则1中记录了then分支的代码起始位置；规则2中，分别记录了then分支和else分支的起始位置； N的作用是生成goto指令坯，N.nextlist只包含这个指令的位置

控制转移语句的回填(3)

Break、Continue的处理虽然break、continue在语法上是一个独立的句子，但是它的代码和外围语句相关。跟踪外围语句S，生成一个跳转指令坯将这个指令坯的位置加入到S的nextlist中。跟踪的方法在符号表中设置break条目，令其指向外围语句在符号表中设置指向S的nextlist的指针，然后把这个指令坯的位置直接加入到nextlist中。