编译原理实践 1.课程说明及引论.

Slides:

Advertisements

Similar presentations

夯实教师教育办好非师范教育 ---- 以外语专业为例河北师范大学李正栓. 1. 坚定不移地实施教师教育 A. 关键词：师范院校师范院校是以培育师资为目的的教育机构，多属于高等教育层级。含 “ 师范大学 ” 或 “ 师范学院 ” 。另外，由师专升为本科的院校多数更名为 “XX 学院 ”

Advertisements

足太阴脾经在足大趾与足阳明胃经衔接，在胸部与手少阴心经相接。联系的脏腑器官有咽、舌，属脾，络胃，注心中。络脉从本经分出，走向足阳明经，进入腹腔，联络肠胃。经别结于咽，贯舌本。经筋结于髀，聚于阴器，上腹，结于脐，散于胸中。第四章足太阴经络与腧穴第一节足太阴经络.

程序设计基础第 2 章解题要有程序主讲：吴献彩 Tel ： QQ ：

邱锡鹏复旦大学计算机科学技术学院 Text Books  “Dragon book”  Compilers: Principles, Techniques, and Tools (2nd Edition)  Alfred V. Aho;Monica S.

中医内科陈良金. 目的要求：熟悉虚劳的证候特征。了解虚劳的发病与气血阴阳及五脏的关系。掌握虚劳和肺痨及一般虚证的区别与联系。掌握虚劳的治疗要点。熟悉虚劳各个证型的辨证论治。了解虚劳的预后及调摄护理。

写作中的几点小技巧金乡县羊山中学张秀玲. 一、写外貌不用 “ 有 ” 作文如何来写外貌？同学们的作文里总会出现类似这样的句子： “ XX 可漂亮了，她有一头卷卷的黄头发，有一双乌黑的葡萄般的大眼睛，有高高的鼻子，还有一张樱桃小嘴。 ” 如果试着去掉文中的 “ 有 ” ，把文字重新修改一遍，

十大写作技巧. 一、写外貌不用 “ 有 ” 作文如何写外貌？孩子的作文里总会看到类似这样的名子： “XX 可漂亮了，她有一头卷卷的黄头发，有一双乌黑的葡萄般的大眼睛，有一个高高的鼻子，还有一张樱桃小嘴。 ” 如果你试着让他们去掉文中的 “ 有 ” ，把文字重新串联一遍，会发现作文顺了很多。写上段文字的同学经蒋老师指导后修改如下：

企业文化与核心价值观主讲：孟凡驰教授中交四航局. 2 目录一、企业文化的目的价值恒久性与工具价值实践性二、企业文化管理学特征三、企业文化与企业发展战略四、企业文化整合、提炼、培育和建设的目的五、集团文化与分公司文化六、企业核心价值观.

招商谈判技巧芝麻官营销. 技巧原则孙子兵法云： “ 兵无常势，水无常形，能因敌之变化而取胜者，谓之神。 ” “ 内功心法 ” 只有在真正实践中才能体会、掌握。谈判有没有具体的套路？有没有 “ 一招制敌 ” 的擒拿手？

“ 十二五 ” 广东省科技计划项目经费监管培训广东省科技厅一、专项经费管理法规一、专项经费管理法规二、经费监督检查二、经费监督检查三、项目预算调整管理三、项目预算调整管理四、课题经费预算执行管理四、课题经费预算执行管理五、项目（课题）财务验收五、项目（课题）财务验收 2.

1 語音下單代表號請輸入分公司代碼 2 位結束請按＃字鍵統一證券您好 ﹗ 請輸入分公司代碼結束請按＃字鍵，如不知分公司代碼請按＊號。請輸入您的帳號後 7 位結束請按＃字鍵請在聽到干擾音時輸入您的密碼結束請按＃字鍵主選單一覽表委託下單請按 1 ；取消下單請按 2 成交回報請按.

平面构成第六章平面构成形式与法则 — 破规与变异. 第七章平面构成形式与法则 — 破规与变异破规与变异构成的形式、有下列四类：一、特异构成特异构成。其表现特征是，在普遍相同性质的事物当中，有个别异质性的事物，便会立即显现出来。

人權教育融入教學與法治教育彭巧綾蔡永棠閱讀理解六頂思考帽以概念圖整理閱讀理解指導學生運用關鍵詞，繪製概念圖，並分享修正。

報酬遞增與新的商業世界.

無性生殖是由親代直接產生新的個體，並不涉及配子的生成與結合。

义务教育课程标准实验教材四年级下册语文园地六词语盘点习作口语交际我的发现日积月累展示台.

被江泽民残酷迫害致死的法轮功学员李竟春，女，1954年3月16日出生，江西省九江市人。于2000年12月18日到北京证实大法，关押在北京市门头沟看守所遭受非人的迫害。在狱中李竟春绝食抗争被管教骗喝一瓶“可疑的豆浆”后一直咳嗽不断，发烧呕吐，吐出白色有强烈异味液体，于2000年1月4日死亡。

目录如何职位分析调查表职位分析的目的与意义职位调查表内容与要点说明职位分析注意事项职位分析调查工作计划.

1 修辞手法 2 表现手法 3 表达方式 4 结构技巧表达技巧.

个人简历制作天津民族中专刘冬.

第十課第九味目錄徐國能課文注釋問題與討論.

軟體工程 -物件導向程式設計與UML系統分析實作

103年度學生健康檢查.

第八章组织文化的整合 ——并购中的文化整合（二）小组成员：浦若蓉、朱谷一、贾彦彦.

教育部補助技專校院推動通識課程革新計畫申請表件說明

C语言程序设计李伟光.

教學經驗分享吳毅成國立交通大學資訊工程系 2012年4月.

第一章認識程式語言.

自然的食物就是你最好的醫生上課之前先聽一首歌~稻香歌詞、音樂還不錯和大家分享一下

怎樣吃才健康? 賴亭竹.

胫腓骨骨折.

专题三生物圈中的绿色植物.

Chapter 12 護照簽證. Chapter 12 護照簽證第一節護照未辦妥辦理護照需要當事人照片二張、身份證正本，辦理時間通常需要5個工作天。旅行社因作業人員疏失，延宕辦理時效，致旅客無法如期出國，應負損害賠償責任。

電腦組合語言光啟高中96學年度第2學期第一篇組合語言開發流程與指令格式.

第二单元（6-9课）近代化的探索.

公关协调能力目标初步学会对内及对外公众关系协调的基本方法。知识目标掌握组织内外公众协调的原理和方法。

新帝國主義開港 (一)臺灣成為侵略者目標 1.背景： A.買賣利豐=鴉片進口+米、糖、樟腦、煤炭出口 B.地理位置優越=航行安全+商貿中心 2.新帝國主義： A.19C中：英、法、美、日為主 B.臺被迫開港通商,割地賠款,簽訂不平等條約.

佳力科技防爆叉车的应用、发展浙江佳力科技股份有限公司.

第二节工业地域的形成工业联系工业集聚工业地域

當代國際企業.

比爾蓋茲導讀.

烟花爆竹企业开复工安全培训参考课件浏阳市安监局.

課程名稱：程式設計授課老師：________

常规免疫接种率监测免疫规划科章梦然.

入托、入学儿童预防接种证查验武平县疾病预防控制中心林传贵

转正述职报告乐恩公司史航

大连理工大学软件学院软件工程系赖晓晨计算机组成与结构大连理工大学软件学院软件工程系赖晓晨

教育部補助技專校院推動通識課程革新計畫申請表件說明

新世代計算機概論第14章　程式語言.

第1章程式語言與Visual Basic的基礎

安裝JDK 安裝Eclipse Eclipse 中文化

语言及其文法.

第一章 C語言概論本章投影片僅供本書上課教師使用，非經同意請勿拷貝或轉載.

第一章计算机语言的学科形态与发展历程计算机语言在计算学科中占有特殊的地位，它是计算学科中最富有智慧的成果之一，它深刻地影响着计算学科各个领域的发展。不仅如此，计算机语言还是程序员与计算机交流的主要工具。因此，可以说如果不了解计算机语言，就谈不上对计算学科的真正了解。

第2次课上下文无关文法

编译技术授课：胡静.

程式設計老師：戴自強助教：楊斯竣.

第 1 章 Java 簡介.

程序基础 2019/4/25.

程式語言程式語言發展史資料型態程式指令程序定義和使用.

計算機概論跨越講義第4章基本視窗程式應用 4-1 程式語言簡介 4-2 結構化VS物件導向程式設計

美麗的西子湖.

導論教學投影片.

知识产权在中小企业中的作用讲座内容一、知识产权在发达国家及知名企业中的地位二、知识产权的基本概念及其特点

编译原理第一章引论南京大学计算机科学与技术系戴新宇.

方格紙上畫正方形.

程式語言簡介 2019/7/17 明乘中學編製.

程式設計與程式語言告訴電腦做些什麼第十六章.

编译原理中南大学软件学院陈志刚.

Presentation transcript:

编译原理实践 1.课程说明及引论

序言《编译原理》的课程实践一般有两种安排：配合编译课程教学，安排多次小型实践，分别支持编译程序的各个阶段针对某一规模适中的语言来设计和实现一个相对完整、独立的编译器。《编译原理实践》作为《编译原理》课程的延伸，目的是让大家动手设计和实现某一规模适中的语言的编译器涉及编译程序的各个阶段强调了编译的总体设计、各个阶段的接口安排等等学会运用所学技术解决实际问题

课程目标回顾编译相关的文法和形式语言基本理论以PL/0语言为例，介绍一个编译程序从语法定义、词法分析、语法分析、出错处理、代码生成到解释执行的全过程。使学生了解什么是编译，并懂得怎样从语言的定义出发，系统地去开发一个语言的编译程序介绍Lex（词法分析程序的生成系统） & Yacc（语法分析程序的生成系统）

PL/0编译器 PL/0 语言程序类 p-code 代码 PL/0编译程序源语言(PL/0) 目标语言(类p-code) 给出一个简单的类Pascal语言，其编译程序用高级语言（C/Pascal）实现。通过剖析该高级语言程序以理解各编译成分的功能及手工实现方法。 PL/0 语言程序类 p-code 代码 PL/0编译程序源语言(PL/0) 目标语言(类p-code) 实现语言(pascal/C) 类 p-code PL/0 pascal/C

PL/0编译系统的结构框架 PL/0源程序 PL/0编译程序类 p－code代码类 p－code解释程序输入数据输出数据

课程作业给出某个语言的词法和语法规则，要求实现该语言编译程序，包括词法分析、语法分析、出错处理、代码生成和解释程序用该语言编若干个程序，用自己开发的编译程序对它编译，在编译过程中要求能连续指出语法错误不中断，能生成代码程序，能解释执行代码程序，最后输出正确结果可以用自己熟悉的程序设计语言实现优秀学生作品演示

详细要求和评分规则见《编译原理实践作业要求》为了避免检查冲突，将把大家分成若干组，每组完成语言的不同扩展指定扩展不加分，非指定扩展视完成情况加分先检查的同学将获得更高的时间分，每组扩展点的难度也是由简单到复杂

考核方式平时成绩(15%) 出勤率课堂练习期末考试(30%)—第10周课程作业成绩(55%)

引论什么是编译程序编译程序的组成编译程序的结构程序设计语言的发展历程构建一个编译器的相关科学

1.什么是编译程序/编译器编译器是将高级语言编写的程序转换成能在一台计算机上执行的等价目标代码或机器语言程序的软件系统可以扩展到包含：将一种高级语言程序转换成另一种高级语言程序的系统从一种机器语言程序转换成另一种机器语言程序的系统从一种高级语言程序转换成一种中间语言程序的系统等等

编译器是一种相当复杂的程序，其代码长度可从10000到1000000行不等。编写甚至读懂这样的一个程序都非易事，大多数的计算机科学家和专业人员从来也没有编写过一个完整的编译器但是，几乎所有形式的计算均要用到编译器，而且任何一个与计算机打交道的专业人员都应掌握编译器的基本结构和操作

编译器是应用程序与操作系统及处理器之间沟通的桥梁处理器与编译器发展相辅相成，没有编译技术做支撑，再好的处理器也没挥不了应有的作用截止2010年，“图灵奖”43年历史中，约1/3的获奖都在“编译技术和程序设计语言”这个领域

编译器历史回顾本世纪40年代，开始时程序都是用机器语言（machine language）编写的。机器语言就是表示机器实际操作的数字代码，例如： C7 06 0000 0002 表示在IBM PC上使用的Intel 8x86处理器将数字 2移至地址0 0 0 0（1 6进制）的指令。

这种代码形式很快就被汇编语言(assembly language)代替了。在汇编语言中，都是以符号形式给出指令和存储地址的。例如，汇编语言指令 MOV X, 2 就与前面的机器指令等价(假设符号存储地址X是0 0 0 0) 汇编程序(assembler)将汇编语言的符号代码和存储地址翻译成与机器语言相对应的数字代码

发展编程技术的下一个重要步骤就是以一个更类似于数学定义或自然语言的简洁形式来编写程序的操作，它应与任何机器都无关，而且也可由一个程序翻译为可执行的代码例如，前面的汇编语言代码可以写成一个简洁的与机器无关的形式 x = 2;

在1954年至1957年期间，IBM的John Backus 带领的一个研究小组对FORTRAN语言及其编译器的开发 Noam Chomsky开始了他的自然语言结构的研究。他的发现最终使得编译器结构异常简单，甚至还带有了一些自动化 Chomsky的研究导致了根据语言文法(grammar) 的难易程度以及识别它们所需的算法来为语言分类

乔姆斯基分类结构( Chomsky hierarchy)---文法的4个层次：0型、1型、2型和3型文法，且其中的每一个都是其前者的专门化 2型(或上下文无关文法(context-free grammar)) 被证明是程序设计语言中最有用的，而且今天它已代表着程序设计语言结构的标准方式

2. 编译程序的组成词法分析符出号错表处管语法分析理语义分析与中间代码生成代码优化目标代码生成源程序单词符号语法单位中间代码目标代码符号表管理编译程序结构框图出错处

编译过程 <1>关键字或保留字(如BEGIN、END、IF) <2>标识符 <3>常数 1.词法分析输入源程序，对构成源程序的字符串进行扫描和分解，识别出一个个具有独立意义的最小语法单位“单词 (token) ” 单词：是语言的基本语法单位，一般语言有四大类单词： <1>关键字或保留字(如BEGIN、END、IF) <2>标识符 <3>常数 <4>分界符(运算符)，如+、-、*、/、；、(、)…

举例： 1)a:=10+c*20 2)while x>0 do x:=x-1 词法分析是一种线性分析

2.语法分析在词法分析的基础上，根据语言的语法定义规则，识别出构成单词符号串的各类语法单位。通过语法分析，确定整个输入符号串是否构成语法上正确的“程序” 举例： a:=10+c*20 语法分析是一种层次分析

3.语义分析与中间代码产生对识别出的各种语法成份进行语义分析，并产生相应的中间代码中间代码：一种介于源语言和目标语言之间的中间语言形式生成中间代码的目的： <1>便于做优化处理 <2>便于编译程序的移植

中间代码的形式：编译程序设计者可以自己设计，常见的中间代码有：三元式、间接三元式、四元式、逆波兰表示、树形表示、 P-Code、C-Code、U- Code、bytecode等中间代码具有易于产生，易于翻译成目标程序的特点，可以看成是一种抽象机的指令代码中间代码的设计在相当大的程度上是一种技巧，而不是科学中间代码设计方案数可能两倍于编译器套件种类数！

举例： a:=10+c*20 由语法分析识别出为赋值语句，语义分析首先要分析语义上的正确性，例如要检查表达式中和赋值号两边的类型是否一致根据赋值语句的语义，生成中间代码。即用一种语言形式来代替另一种语言形式，这是翻译的关键步骤。

4.代码优化经过语义分析后，编译程序将源程序生成中间代码，这时的中间代码往往有些重复和冗余。对代码进行优化的目的是提高目标程序的执行效率代码优化首先在中间代码上进行。在局部范围可能做的优化有常数表达式的计算或根据操作符的某些性质如可结合性、可交换性和分配性以及检测公共子表达式进行优化不同的编译器所作的代码优化工作量相差很大

5.目标代码生成编译的最后一步是将中间代码生成特定机器上的低级语言代码这部分与机器类型有关，对程序中的每个变量指定存贮单元，把中间代码的指令翻译成等价的某种类型机器的机器指令代码或汇编指令代码

目标代码的形式可以是绝对指令代码、可重定位的机器指令代码或汇编指令代码如果目标是绝对指令代码，则可立即执行如果是汇编指令代码，还需经汇编程序翻译后才能运行现在多数编译程序产生的是可重定位的机器指令代码，这种目标代码在运行前必须借助于一个连接装配程序把各个目标模块（包括系统提供的库模块）连接在一起，确定程序中的变量在内存中的位置，装入内存中指定起始地址，使之成为一个可以运行的绝对指令代码程序

什么是链接器（Linker）链接器的功能是，将一个或多个由编译器生成的目标文件及库链接为一个可执行文件。

注意！上述编译过程的5个阶段是一种典型的分法，并非所有的编译程序都分成5个阶段本书中PL/0语言的编译程序省略了优化阶段；同时省去了最后的目标代码生成阶段，取而代之的是增加一个解释程序，由解释程序来解释执行中间代码程序，同样可以得到最终结果

编译和解释解释程序：在解释程序的执行过程中不产生目标代码。每读一条源程序代码，就将它解释成等价的若干条机器代码，并执行之。一些规模较小的语言，如BASIC，常采用此方式。通常把编译和解释作某种程度的结合。如Java，先将源程序由java编译器(javac)编译生成字节码 (bytecode)文件，然后由一个虚拟机对得到的字节码加以解释执行(java)。注：字节码文件是与平台无关的二进制码。 PL/0编译程序也采用了编译和解释相结合的方式

6.符号表管理编译过程中要记录源程序中出现的标识符，并收集每个标识符的各种属性信息。为此需要建立一个符号表记录有关标识符的各种信息。符号表是由若干记录组成的数据结构，每个标识符在表中有一条记录，每条记录有多个域，每个域记载标识符的一个属性。符号表的设计在很大程度上说它是一种艺术比说它是科学原理更合适：符号表的属性随语言的不同而变化，全局符号表最重要的是接口和性能，等等

7.出错处理编译的各个阶段都可能发现源程序中的错误。发现错误后如果立即停止编译，往往会降低调试程序的效率，所以应对出现的错误做适当的处理，从而使编译能继续进行。词法分析可以检测出源程序中的非法符号，就好比自然语言语句中的出现的错字、错词。语法分析能够发现程序语句中的各种语法错误，如括号不匹配等等。语义分析能判断运算对象的类型是否匹配、变量是否重复声明或没声明就使用等错误。任意时刻发现错误，都应该报告错误信息，包括错误出现的位置、错误性质等，为程序员调试程序提供方便。由此可见，错误检测和恢复也是编译程序中的一项重要工作。

3. 编译程序的结构在设计和实现编译程序时，要考虑编译程序分“遍” 的问题。所谓一“遍”是指在编译时把源程序或者中间形式从头到尾扫描一遍，并作相关处理，生成新的中间形式或目标代码采用不同的分遍方式，编译程序的结构也有所不同

单遍编译程序单遍编译程序只对源程序进行一遍扫描，就完成编译的各项任务，产生目标代码。在单遍编译程序中，往往以语法分析程序为中心，词法分析和语义分析作为语法分析的子程序。其工作过程如下：当语法分析需要读进一个新单词时，就调用词法分析子程序。词法分析子程序则从源程序中依次读入字符，组合成单词符号，并将单词符号返回给语法分析程序。当语法分析程序识别出一个语法成分时，就调用语义分析子程序进行语义分析，并生成目标程序。当源程序处理完后，进行善后处理，优化目标程序。

单遍编译程序语法成分语法分析语义分析生成目标程序 S.P. 返回分析结果取单词整理目标程序停机返回单词词法分析 O.P.

多遍编译程序有的编译程序把编译程序的五项任务分几遍来进行，每遍只完成部分任务，多遍编译程序的工作过程如下：调用词法分析程序将高级语言源程序转换成用单词符号表示的程序，即将字符串程序转换成单词符号串源程序。调用语法分析程序对符号串源程序进行语法归类检查。调用语义分析程序进行语义检查，并生成中间的代码程序。调用代码优化程序对中间代码程序进行优化。调用目标生成程序将优化后的中间代码程序转换成目标代码程序。

源程序词法分析语法分析语义分析代码优化目标代码生成错误处理符号表目标程序多遍编译程序结构

实际上，根据语言的不同，编译器可以是一遍 (one pass)——所有的阶段由一遍完成，其结果是编译得很好，但(通常)代码却不太有效。大多数带有优化的编译器都需要超过一遍：典型的安排是将一遍用于扫描和分析，将另一遍用于语义分析和源代码层优化，第3遍用于代码生成和目标层的优化。更深层的优化则可能需要更多的遍： 5遍、6遍、甚至8遍都是可能的。

试问世界上第一个编译程序是用什么语言书写的？用高级语言书写？ *没有编译器，如何编译？因此世界上第一个编译器只能是用机器语言开发的

编译程序的自展技术直接用目标机器上的机器语言书写源语言的编译程序工作量太大用目标机器上的机器语言书写源语言的一个子集的编译程序，然后再用这个子集作为书写语言，实现源语言的编译程序。

如果把这个过程根据情况分为若干步，像滚雪球一样直到生成预计源语言的编译程序为止，我们把这样的实现方式称为自展技术简要来说就是：用被编译的语言来书写该语言自身的编译程序

4.程序设计语言的发展历程按语言的代分类第一代：机器语言第二代：汇编语言第三代：高级程序设计语言，如 Fortran,Cobol,Lisp,C,C++,C#,Java 第四代：为特定应用设计的语言，如用于数据库查询的SQL，用于文字排版的Postscript 第五代：基于逻辑和约束的语言，如Prolog和 OPS5

按程序中指名如何完成一个计算任务来分类命令式语言：用命令式程序设计语言编写程序，就是描述解题过程中每一步的过程，程序的运行过程就是问题的求解过程，因此也称为过程式语言。如 C,C++,C#和Java等声明式语言：描述目标性质，让计算机明白目标，而非流程。声明式编程通常被看做是形式逻辑的理论，把计算看做推导。如 ML,Haskell,Prolog,HTML,CSS,正则表达式等还有些语言是混合式的，既有声明式，也有动作处理

对编译器的影响程序设计语言的发展对编译器设计提出了新的要求，编译器也推动了这些高级语言的使用编译器必须能够正确翻译源语言书写的所有程序，这样的程序的集合通常是无穷的。为一个源程序生成最佳目标代码的问题一般来说是不可判定的有关编译器的研究也是关于如何使用理论来解决实践问题的研究

构建一个编译器的相关科学编译器的设计中，有很多通过数学方法抽象出问题本质从而解决现实世界中复杂问题的完美例子对编译器的研究主要是如何设计正确的数学模型和选择正确算法的研究需要考虑到对通用性及功能的要求与简单性及有效性之间的平衡

最基本的数学模型是有穷状态自动机和正则表达式：用于描述词法单位以及描述被编译器用来识别这些单位的算法上下文无关文法：用于描述程序设计语言的语法结构树形结构：表示程序结构以及程序到目标代码的翻译方法的重要模型

编译技术的应用懂得编译有助于深刻理解和正确使用程序设计语言，有助于加深对整个计算机系统的理解虽然只有少数人从事构造或维护编译器的工作，但是大部分系统软件和应用程序的开发，通常要用到编译原理和技术例如，设计词法分析器的串匹配技术已用于正文编辑器、信息检索和模式识别程序。上下文无关文法和语法制导定义已用于创建诸如排版、绘图系统和语言结构化编辑器，等等。