编译原理第十一章代码生成编译原理.

编译原理第十一章代码生成编译原理

源程序表词法分析器出单词符号格错语法分析器管处语法单位理理中间代码生成器四元式优化段四元式目标代码生成器
编译原理

代码生成是把语法分析后或优化后的中间代码变换成目标代码。目标代码一般有以下三种形式：
能够立即执行的机器语言代码，所有地址已经定位；待装配的机器语言模块。执行时，由连接装配程序把它们和某些运行程序连接起来，转换成能执行的机器语言代码；汇编语言代码。尚须经过汇编程序汇编，转换成可执行的机器语言代码。编译原理

代码生成着重考虑的问题：如何使生成的目标代码较短；如何充分利用计算机的寄存器，减少目标代码中访问存贮单元的次数。
如何充分利用计算机的指令系统的特点。编译原理

11.1 基本问题代码生成器的输入代码生成器的输入包括源程序的中间表示，以及符号表中的信息类型检查编译原理
11.1 基本问题代码生成器的输入代码生成器的输入包括源程序的中间表示，以及符号表中的信息类型检查假定已经作过必要的类型检查，所以在必要的地方已经加入了类型转换操作，并且已检测出一些明显的语义错误。这样代码生成阶段就可以假设它的输入是没有错误的。编译原理

11.1 基本问题目标程序指令选择绝对机器代码、可再定位机器语言、汇编语言采用汇编代码作为目标语言 a:=a+1 INC a
11.1 基本问题目标程序绝对机器代码、可再定位机器语言、汇编语言采用汇编代码作为目标语言指令选择 a:=a+1 INC a LD R0, a ADD R0, #1 ST R0, a 编译原理

11.1 基本问题寄存器分配计算顺序选择在寄存器分配期间，为程序的某一点选择驻留在寄存器中的一组变量。
11.1 基本问题寄存器分配在寄存器分配期间，为程序的某一点选择驻留在寄存器中的一组变量。在随后的寄存器指派阶段，挑出变量将要驻留的具体寄存器。计算顺序选择编译原理

11.2 目标机器模型考虑一个抽象的计算机模型具有多个通用寄存器，他们既可以作为累加器，也可以作为变址器。运算必须在某个寄存器中进行。
11.2 目标机器模型考虑一个抽象的计算机模型具有多个通用寄存器，他们既可以作为累加器，也可以作为变址器。运算必须在某个寄存器中进行。含有四种类型的指令形式编译原理

如果op是一目运行符，则“op Ri, M”的意义为：op（M） Ri，其余类型可类推。
编译原理

op 包括一般计算机上常见的一些运算符，如 ADD 加 SUB 减 MUL 乘 DIV 除
编译原理

编译原理

11.3 一个简单代码生成器不考虑代码的执行效率，目标代码生成是不难的，例如： A:=(B+C)*D+E 翻译为四元式： T1:=B+C
11.3 一个简单代码生成器不考虑代码的执行效率，目标代码生成是不难的，例如： A:=(B+C)*D+E 翻译为四元式： T1:=B+C T2:=T1*D T3:=T2+E A:=T3 编译原理

假设只有一个寄存器可供使用目标代码： LD R0，B ADD R0 ，C ST R0 ，T1 四元式T1:=B+C
假设T1，T2，T3在基本块之后不再引用: LD R0，B ADD R0，C MUL R0，D ADD R0，E ST R0，A T2:=T1*D LD R0 ，T1 MUL R0，D ST R0 ，T2 T3:=T2+E LD R0 ，T2 ADD R0 ，E ST R0 ，T3 A:=T3 LD R0，T3 ST R0 ，A 编译原理

11.3 一个简单代码生成器四元式的中间代码变换成目标代码，并在一个基本块的范围内考虑如何充分利用寄存器：
11.3 一个简单代码生成器四元式的中间代码变换成目标代码，并在一个基本块的范围内考虑如何充分利用寄存器：尽可能留：在生成计算某变量值的目标代码时，尽可能让该变量保留在寄存器中。尽可能用：后续的目标代码尽可能引用变量在寄存器中的值，而不访问内存。及时腾空：在离开基本块时，把存在寄存器中的现行的值放到主存中。编译原理

待用信息如果在一个基本块内，四元式i对A定值，四元式j要引用A值，而从i到j之间没有A的其他定值，那么，我们称j是四元式i的变量A的待用信息。（即下一个引用点） i: A:=B op C … j: D:=A op E 假设在变量的符号表登记项中含有记录待用信息和活跃信息的栏。编译原理

1 (x,x)表示变量的待用信息和活跃信息。其中i表示待用信息，y表示活跃，^表示非待用和非活跃；
待用信息和活跃信息的表示： 1 (x,x)表示变量的待用信息和活跃信息。其中i表示待用信息，y表示活跃，^表示非待用和非活跃； 2 在符号表中，(x，x)→(x，x)表示后面的符号对代替前面的符号对； 3 不特别说明，所有说明变量在基本块出口之后均为非活跃变量。编译原理

计算待用信息和活跃信息的算法步骤： 1. 开始时，把基本块中各变量的符号表登记项中的待用信息栏填为“非待用”，并根据该变量在基本块出口之后是不是活跃的，把其中的活跃信息栏填为“活跃”或“非活跃”；编译原理

2. 从基本块出口到基本块入口由后向前依次处理各个四元式。对每一个四元式i: A:=B op C，依次执行下面的步骤：
1) 把符号表中变量A的待用信息和活跃信息附加到四元式i上； 2) 把符号表中A的待用信息和活跃信息分别置为“非待用”和“非活跃”； 3) 把符号表中变量B和C的待用信息和活跃信息附加到四元式i上； 4) 把符号表中B和C的待用信息均置为i，活跃信息均置为“活跃”。编译原理

建立待用信息链表与活跃变量信息链表如下：
例：基本块 1. T:=A-B 2. U:=A-C 3. V:=T+U 4. W:=V+U 设W是基本块出口之后的活跃变量。建立待用信息链表与活跃变量信息链表如下：编译原理

编译原理

附加在四元式上的待用/活跃信息表：序号四元式左值左操作数右操作数 (4) W:=V+U (^,y) (^,^) (^,^)
序号四元式左值左操作数右操作数 (4) W:=V+U (^,y) (^,^) (^,^) (4,y) (3) V:=T+U (^,^) (4,y) (3,y) (^,^) (^,^) (2) U:=A-C (1) T:=A-B (3,y) (2,y) (^,^) 变量名初始状态→信息链(待用/活跃信息栏) T (^,^) A B C U V W (^,y) → (3,y) → (^,^) → (2,y) → (1,y) → (1,y) → (2,y) → (4,y) → (3,y) → (^,^) → (4,y) → (^,^) → (^,^) 编译原理

编译原理

寄存器描述数组RVALUE 变量地址描述数组AVALUE 动态记录各寄存器的使用信息 RVALUE[R]={A,B}
动态记录各变量现行值的存放位置 AVALUE[A]={R1, R2, A} 编译原理

补充说明：因为寄存器的分配是局限于基本块范围之内的，一旦处理完基本块中所有四元式，对现行值在寄存器中的每个变量，如果它在基本块之后是活跃的，则要把它存在寄存器中的值存放到它的主存单元中。要特别强调的是，对形如：A:=B的四元式，如果B的现行值在某寄存器Ri中，则无须生成目标代码，只须在RVALUE(Ri)中增加一个A，(即把Ri同时分配给B和A)，并把AVALUE(A)改为Ri 。编译原理

对每个四元式: i: A:=B op C，依次执行：
代码生成算法：对每个四元式: i: A:=B op C，依次执行： 1. 以四元式: i: A:=B op C 为参数，调用函数过程GETREG(i: A:=B op C)，返回一个寄存器R，用作存放A的寄存器。 2. 利用AVALUE[B]和AVALUE[C]，确定B和C现行值的存放位置B’和C’。如果其现行值在寄存器中，则把寄存器取作B’和C’ 编译原理

如果B’或C’为R，则删除AVALUE[B]或AVALUE[C]中的R。 4. 令AVALUE[A]={R}, RVALUE[R]={A}。
3. 如果B’≠R，则生成目标代码： LD R, B’ op R, C’ 否则生成目标代码 op R, C’ 如果B’或C’为R，则删除AVALUE[B]或AVALUE[C]中的R。 4. 令AVALUE[A]={R}, RVALUE[R]={A}。编译原理

5. 若B或C的现行值在基本块中不再被引用，也不是基本块出口之后的活跃变量，且其现行值在某寄存器Rk中，则删除 RVALUE[Rk]中的B或C以及AVALUE[B]或 AVALUE[C] 中的Rk ，使得该寄存器不再为B或C占用。编译原理

寄存器分配：GETREG(i: A:=B op C) 返回一个用来存放A的值的寄存器
1 如果B的现行值在某个寄存器Ri中，RVALUE[Ri]中只包含B，此外，或者B与A是同一个标识符，或者B的现行值在执行四元式A:=B op C之后不会再引用，则选取Ri为所需要的寄存器R，并转4； 2 如果有尚未分配的寄存器，则从中选取一个Ri为所需要的寄存器R，并转4； 1 尽可能用B独占的寄存器 2 后尽可能用空闲寄存器 3 抢占用非空闲寄存器编译原理

3 从已分配的寄存器中选取一个Ri为所需要的寄存器R。最好使得Ri满足一下条件：
1 尽可能用B所在的寄存器 2 后尽可能用空闲寄存器 3 抢占用非空闲寄存器 3 从已分配的寄存器中选取一个Ri为所需要的寄存器R。最好使得Ri满足一下条件：占用Ri的变量的值也同时存放在该变量的贮存单元中，或者在基本块中要在最远的将来才会引用到或不会引用到。要不要为Ri中的变量生成存数指令？编译原理

要不要为Ri中的变量生成存数指令？ 4 给出R，返回。
对RVALUE[Ri]中每一变量M，如果M不是A，或者如果M是A又是C，但不是B并且B也不在RVALUE[Ri]中，则 (1) 如果AVALUE[M]不包含M，则生成目标代码 ST Ri，M (2) 如果M是B，或者M是C但同时B也在RVALUE[Ri]中，则令AVALUE[M]={M， Ri} ，否则令AVALUE[M]={M} (3) 删除RVALUE[Ri]中的M 4 给出R，返回。编译原理

设W是基本块出口之后的活跃变量，只有R0和R1是可用寄存器，生成的目标代码和相应的RVALUE和AVALUE:
例：基本块 1. T:=A-B 2. U:=A-C 3. V:=T+U 4. W:=V+U 设W是基本块出口之后的活跃变量，只有R0和R1是可用寄存器，生成的目标代码和相应的RVALUE和AVALUE: 编译原理

中间代码目标代码 RVALUE AVALUE
LD R0，A SUB R0，B R0含有T T在R0中 T:=A－B U:=A－C LD R1，A SUB R1，C R0含有T R1含有U T在R0中 U在R1中 V:=T＋U ADD R0，R1 R0含有V R1含有U V在R0中 U在R1中 W:=V＋U ADD R0，R1 R0含有W W在R0中 ST R0，W 编译原理

作业 P327-1 编译原理

编译原理第十一章代码生成编译原理.

Similar presentations

Presentation on theme: "编译原理第十一章代码生成编译原理."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

编译原理 第十一章 代码生成 编译原理.

Similar presentations

Presentation on theme: "编译原理 第十一章 代码生成 编译原理."— Presentation transcript:

Similar presentations

About project

反馈

编译原理第十一章代码生成编译原理.

Presentation on theme: "编译原理第十一章代码生成编译原理."— Presentation transcript: