程序的转换与机器级表示主要教学目标了解高级语言与汇编语言、汇编语言与机器语言之间的关系

Slides:

Advertisements

Similar presentations

Assembly Language Programming 湛江师范学院汇编语言程序设计实验课件主讲教师：王晓晔.

Advertisements

信息技术：硬件、软件、网络、数据库计算机技术、多媒体技术、压缩技术...

2017年3月5日单片机原理与应用背景知识调查.

程序的转换与机器级表示主要教学目标了解高级语言与汇编语言、汇编语言与机器语言之间的关系

计算机体系结构 Computer Architecture

计算机体系结构应用程序软件操作系统编译器固件指令集输入输出 CPU 硬件内存 (I/O) 集成电路元件，逻辑门.

第三章计算机核心部件及其工作原理.

第1讲实验环境.

程序的转换与机器级表示主要教学目标了解高级语言与汇编语言、汇编语言与机器语言之间的关系

1.1 计算机系统简介 1.2 计算机的基本组成 1.3 计算机硬件的主要技术指标 1.4 本书结构.

计算机基础知识丁家营镇九年制学校徐中先.

第三章 CPU子系统西南石油大学计算机科学学院主讲教师杨梅联系电话：

Hadoop I/O By ShiChaojie.

第四章典型CPU及指令系统举例.

第2章汇编语言与汇编程序 ——8086/8088指令系统 mov ax,12h call display Jmp 1234h.

指令集架構計算機也跟人類一樣，需要提供一套完整的語言讓人們跟它充分溝通，以完成正確的計算工作。

第八章菜单设计 §8.1 Visual FoxPro 系统菜单 §8.2 为自己的程序添加菜单 §8.3 创建快捷菜单.

計算機結構 – 概論陳鍾誠於金門大學.

编译原理与技术 2018/11/30 《编译原理与技术》讲义.

第 5 章、連結與載入作者：陳鍾誠旗標出版社.

第3章 8086/8088指令系统 mov ax,12h call display Jmp 1234h.

基本的”防”黑客技术 Basic” ” Hacker Technique

走进编程程序的顺序结构（二）.

7.1 机器指令 7.2 操作数类型和操作类型 7.3 寻址方式 7.4 指令格式举例 7.5 RISC 技术.

Zhao4zhong1 (赵中) C语言指针与汇编语言地址.

Zhao4zhong1 (赵中) C语言指针与汇编语言地址.

第一单元初识C程序与C程序开发平台搭建 ---观其大略

第十章 IDL访问数据库 10.1 数据库与数据库访问 1、数据库数据库中数据的组织由低到高分为四级：字段、记录、表、数据库四种。

computer organization principle

本节内容模拟线程切换视频提供：昆山滴水信息技术有限公司官网地址：论坛地址： QQ交流：

逆向工程-汇编语言

CPU结构和功能.

中国科学技术大学计算机系陈香兰（0512－）助教：孟宁 Fall 2009

中国科学技术大学计算机系陈香兰（0551－） Spring 2009

《编译原理与技术》期末复习计算机科学与技术学院郑启龙李诚 25/12/2018.

Instructions： Language of the Machine

宁波市高校慕课联盟课程与进行交互 Linux 系统管理.

宁波市高校慕课联盟课程与进行交互 Linux 系统管理.

Unit 11.Operating System 11.1 What’s OS 11.2 Related Courses

第7章在C/C++中使用汇编罗文坚中国科大计算机学院

C++语言程序设计 C++语言程序设计第七章类与对象第十一组 C++语言程序设计.

C语言程序设计主讲教师：陆幼利.

简单介绍用C++实现简单的模板数据结构 ArrayList(数组, 类似std::vector)

微机系统的组成.

第 3 章、組合語言作者：陳鍾誠旗標出版社.

微机原理与接口技术微机原理与接口技术朱华贵 2015年11月13日.

2019/4/29 计算机组成原理辅导教师：陆明强.

工业机器人知识要点解析（ABB机器人）主讲人：王老师

第二章补充知识 2.1 总线和三态门一、总线（BUS）三总线结构数据总线DB（Data Bus）

<编程达人入门课程> 本节内容内存的使用视频提供：昆山爱达人信息技术有限公司官网地址：联系QQ： QQ交流群： ,

第4章 Excel电子表格制作软件 4.4 函数（一）.

本节内容内存复制指令视频提供：昆山爱达人信息技术有限公司官网地址：联系QQ: QQ交流群：联系电话：

iSIGHT 基本培训使用 Excel的栅栏问题

LOGIX500软件入门西安华光信息技术有限公司 2008年7月11日.

College of Computer Science & Technology

临界区问题的硬件指令解决方案（Synchronization Hardware）

GIS基本功能数据存储与管理数据采集数据处理与编辑空间查询空间查询 GIS能做什么？与分析叠加分析缓冲区分析网络分析

本节内容 C语言的汇编表示视频提供：昆山爱达人信息技术有限公司官网地址：联系QQ: QQ交流群：联系电话：

本节内容通用寄存器视频提供：昆山爱达人信息技术有限公司官网地址：联系QQ: QQ交流群：联系电话：

实验目的：掌握数据的顺序存储结构及它们在计算机中的操作。实验内容：

微机原理与接口技术西安邮电大学计算机学院宁晓菊.

C++语言程序设计 C++语言程序设计第一章 C++语言概述第十一组 C++语言程序设计.

本节内容动态链接库视频提供：昆山爱达人信息技术有限公司官网地址：联系QQ： QQ交流群：联系电话：

本节内容导出表视频提供：昆山爱达人信息技术有限公司官网地址：联系QQ: QQ交流群：联系电话：

本节内容进程视频提供：昆山爱达人信息技术有限公司官网地址：联系QQ: QQ交流群：联系电话：

FVX1100介绍法视特（上海）图像科技有限公司施俊.

第三章 CPU子系统西南石油大学计算机科学学院主讲教师杨梅联系电话：

第3章 CPU子系统西南石油大学计算机科学学院主讲教师杨梅联系电话：

Presentation transcript:

第三章程序的转换与机器级表示程序转换概述 IA-32 /x86-64指令系统 C语言程序的机器级表示复杂数据类型的分配和访问越界访问和缓冲区溢出、x86-64架构

程序的转换与机器级表示主要教学目标了解高级语言与汇编语言、汇编语言与机器语言之间的关系掌握有关指令格式、操作数类型、寻址方式、操作类型等内容了解高级语言源程序中的语句与机器级代码之间的对应关系了解复杂数据类型（数组、结构等）的机器级实现主要教学内容介绍C语言程序与IA-32机器级指令之间的对应关系。主要包括：程序转换概述、IA-32指令系统、C语言中控制语句和过程调用等机器级实现、复杂数据类型（数组、结构等）的机器级实现等。本章所用的机器级表示主要以汇编语言形式表示为主。

程序的机器级表示分以下五个部分介绍第一讲：程序转换概述机器指令和汇编指令机器级程序员感觉到的属性和功能特性高级语言程序转换为机器代码的过程第二讲：IA-32 /x86-64指令系统第三讲： C语言程序的机器级表示过程调用的机器级表示选择语句的机器级表示循环结构的机器级表示第四讲：复杂数据类型的分配和访问数组的分配和访问结构体数据的分配和访问联合体数据的分配和访问数据的对齐第五讲：越界访问和缓冲区溢出从高级语言程序出发，用其对应的机器级代码以及内存（栈）中信息的变化来说明底层实现围绕C语言中的语句和复杂数据类型，解释其在底层机器级的实现方法

回顾：冯.诺依曼结构计算机模型 CPU 存储器控制器输入 GPRs 设备 ALU 输出设备地址标志寄控制存器 … … 数据控制控制器 PC MAR 输入设备 GPRs 1 标志寄存器 ALU 2 1 3 … 4 输出设备 K-1 5 … IR MDR N-1

回顾：冯.诺依曼结构计算机模型你还记得冯.诺依曼计算机结构的特点吗？ CPU 存储器控制器输入 GPRs 设备 ALU 输出设备 1 2 3 4 5 6 7 地址数据控制控制器 PC MAR 输入设备 GPRs 1 2 3 标志寄存器 ALU 输出设备 IR MDR 你能想到计算机相当于现实生活中的什么呢？工厂、饭店？计算机是如何工作的呢？

计算机是如何工作的？先想象一下妈妈是怎样做一桌你喜欢（指定）的菜的？ CPU 存储器控制器输入 GPRs 设备 ALU 输出设备 1 2 3 4 5 6 7 地址数据控制控制器 PC MAR 输入设备 GPRs 1 2 3 标志寄存器 ALU 输出设备 IR MDR

计算机是如何工作的？类似“存储程序”工作方式做菜前原材料（数据）和菜谱（指令）都按序放在厨房外的架子（存储器）上，每个架子有编号（存储单元地址）。菜谱上信息：原料位置、做法、做好的菜放在哪里等例如，把10、11号架上的原料一起炒，并装入3号盘然后，我告诉妈妈从第5个架上（起始PC=5）指定菜谱开始做开始做菜第一步：从5号架上取菜谱（根据PC取指令）第二步：看菜谱（指令译码）第三步：从架上或盘中取原材料（取操作数）第四步：洗、切、炒等具体操作（指令执行）第五步：装盘或直接送桌（回写结果）第六步：算出下一菜谱所在架子号6=5+1（修改PC的值）继续做下一道菜（执行下一条指令）

计算机是如何工作的？你能告诉我计算机是如何工作的吗？ “存储程序”工作方式！ CPU 存储器控制器输入设备 GPRs ALU 输出如果你知道你妈妈是如何做菜的，你就已经知道计算机是如何工作的！你能告诉我计算机是如何工作的吗？ “存储程序”工作方式！ CPU 存储器 1 2 3 4 5 6 7 地址数据控制控制器 PC MAR 输入设备 GPRs 1 2 3 标志寄存器 ALU 输出设备 IR MDR

计算机是如何工作的？程序由指令组成（菜单由菜谱组成）程序在执行前数据和指令事先存放在存储器中，每条指令和每个数据都有地址，指令按序存放，指令由OP、ADDR字段组成，程序起始地址置PC （原材料和菜谱都放在厨房外的架子上，每个架子有编号。妈妈从第5个架上指定菜谱开始做）开始执行程序第一步：根据PC取指令（从5号架上取菜谱）第二步：指令译码（看菜谱）第三步：取操作数（从架上或盘中取原材料）第四步：指令执行（洗、切、炒等具体操作）第五步：回写结果（装盘或直接送桌）第六步：修改PC的值（算出下一菜谱所在架子号6=5+1）继续执行下一条指令（继续做下一道菜）

指令和数据程序启动前，指令和数据都存放在存储器中，形式上没有差别，都是0/1序列采用”存储程序“工作方式：程序由指令组成，程序被启动后，计算机能自动取出一条一条指令执行，在执行过程中无需人的干预。指令执行过程中，指令和数据被从存储器取到CPU，存放在CPU内的寄存器中指令中需给出的信息：操作性质（操作码）源操作数1 或/和源操作数2 （立即数、寄存器编号、存储地址）目的操作数地址（寄存器编号、存储地址）存储地址的描述与操作数的数据结构有关！

“指令”的概念计算机中的指令有微指令、机器指令和伪（宏）指令之分机器指令处于硬件和软件的交界面相当于一个菜谱指定的一个完整做菜过程本章中提及的指令都指机器指令微指令是微程序级命令，属于硬件范畴相当于洗、切、煮、炒等做菜“微过程“ 伪指令是由若干机器指令组成的指令序列，属于软件范畴相当于由多个菜谱合成一个”大菜“的过程汇编指令是机器指令的汇编表示形式，即符号表示机器指令和汇编指令一一对应，它们都与具体机器结构有关，都属于机器级指令

程序的转换 temp = v[k]; v[k] = v[k+1]; v[k+1] = temp; 汇编指令软件 lw $15, 0($2) sw $16, 0($2) sw $15, 4($2) 机器指令 100011 00010 01111 0000 0000 0000 0000 100011 00010 10000 0000 0000 0000 0100 101011 00010 10000 0000 0000 0000 0000 101011 00010 01111 0000 0000 0000 0100 硬件 … , EXTop=1,ALUSelA=1,ALUSelB=11,ALUop=add, IorD=1,Read,MemtoReg=1,RegWr=1,...... 微指令 … 1 1 11 100 1 0 1 1 …

机器级指令 mov [bx+di-6], cl 或 movb %cl, -6(%bx,%di) 机器指令和汇编指令一一对应，都是机器级指令机器指令是一个0/1序列，由若干字段组成汇编指令是机器指令的符号表示（可能有不同的格式） mov、movb、bx、%bx等都是助记符指令的功能为：M[R[bx]+R[di]-6]←R[cl] 补码11111010的真值为多少？操作码寻址方式寄存器编号立即数(位移量) mov [bx+di-6], cl movb %cl, -6(%bx,%di) 或 Intel格式 AT&T 格式 R：寄存器内容 M：存储单元内容寄存器传送语言 RTL（Register Transfer Language）注：也有用(x)表示地址x中的内容

指令集体系结构ISA ISA（Instruction Set Architecture）位于软件和硬件之间硬件的功能通过ISA提供出来可执行的指令的集合，包括指令格式、操作种类以及每种操作对应的操作数的相应规定；指令可以接受的操作数的类型；操作数所能存放的寄存器组的结构，包括每个寄存器的名称、编号、长度和用途；操作数所能存放的存储空间的大小和编址方式；操作数在存储空间存放时按照大端还是小端方式存放；指令获取操作数的方式，即寻址方式；指令执行过程的控制方式，包括程序计数器、条件码定义等。 I/O CPU Compiler Operating System Application Digital Design Circuit Design Instruction Set Architecture MM Assembler

IA-32的体系结构是怎样的呢？ CPU 存储器控制器输入 GPRs 设备 ALU 输出设备你妈会做的菜和厨师会做的菜不一样，同一个菜谱的做法也可能不同如同不同架构支持的指令集不同，同一种指令的实现方式和功能也可能不同 CPU 存储器 1 2 3 4 5 6 7 地址数据控制控制器 PC MAR 输入设备 GPRs 1 2 3 标志寄存器 ALU 输出设备 IR MDR

高级语言程序转换为机器代码的过程用GCC编译器套件进行转换的过程预处理：在高级语言源程序中插入所有用#include命令指定的文件和用#define声明指定的宏。编译：将预处理后的源程序文件编译生成相应的汇编语言程序。汇编：由汇编程序将汇编语言源程序文件转换为可重定位的机器语言目标代码文件。链接：由链接器将多个可重定位的机器语言目标文件以及库例程（如printf()库函数）链接起来，生成最终的可执行目标文件。

GCC使用举例两个源程序文件test1.c和test2.c，最终生成可执行文件为test gcc -O1 test1.c test2.c -o test 选项-O1表示一级优化，-O2为二级优化，选项-o指出输出文件名目标文件可用“objdump -d test.o” 反汇编为汇编语言程序 00000000 <add>: 0: 55 push %ebp 1: 89 e5 mov %esp, %ebp 3: 83 ec 10 sub $0x10, %esp 6: 8b 45 0c mov 0xc(%ebp), %eax 9: 8b 55 08 mov 0x8(%ebp), %edx c: 8d 04 02 lea (%edx,%eax,1), %eax f: 89 45 fc mov %eax, -0x4(%ebp) 12: 8b 45 fc mov -0x4(%ebp), %eax 15: c9 leave 16: c3 ret gcc -E test.c -o test.i gcc -S test.i -o test.s 位移量机器指令汇编指令 test.s gcc –S test.c –o test.s add: pushl %ebp movl %esp, %ebp subl $16, %esp movl 12(%ebp), %eax movl 8(%ebp), %edx leal (%edx, %eax), %eax movl %eax, -4(%ebp) movl -4(%ebp), %eax leave ret 编译得到的与反汇编得到的汇编指令形式稍有差异

两种目标文件 test.o：可重定位目标文件 test：可执行目标文件 “objdump -d test” 结果 “objdump -d test.o”结果 00000000 <add>: 0: 55 push %ebp 1: 89 e5 mov %esp, %ebp 3: 83 ec 10 sub $0x10, %esp 6: 8b 45 0c mov 0xc(%ebp), %eax 9: 8b 55 08 mov 0x8(%ebp), %edx c: 8d 04 02 lea (%edx,%eax,1), %eax f: 89 45 fc mov %eax, -0x4(%ebp) 12: 8b 45 fc mov -0x4(%ebp), %eax 15: c9 leave 16: c3 ret 080483d4 <add>: 80483d4: 55 push ... 80483d5: 89 e5 … 80483d7: 83 ec 10 … 80483da: 8b 45 0c … 80483dd: 8b 55 08 … 80483e0: 8d 04 02 … 80483e3: 89 45 fc … 80483e6: 8b 45 fc … 80483e9: c9 … 80483ea: c3 ret test.o中的代码从地址0开始，test中的代码从80483d4开始！

可执行文件的存储器映像内核区栈区共享库的代码堆区程序(段)头表描述如何映射 brk 从可执行文件装入 Kernel virtual memory Memory-mapped region for shared libraries Run-time heap (created by malloc) User stack (created at runtime) Unused Read/write segment (.data, .bss) Read-only segment (.init, .text, .rodata) 内核区 0xC00000000 ELF header Segment header table .text section .data section .bss section .symtab .debug .rodata section .line .init section .strtab 栈区 %esp (栈顶) 共享库的代码 brk 堆区从可执行文件装入 0x08048000

总结高级语言程序总是转换为机器代码才能在机器上执行转换过程：预处理、编译、汇编、链接机器代码是二进制代码，可DUMP为汇编代码表示 ISA规定了一台机器的指令系统涉及到的所有方面例如：所有指令的指令格式、功能通用寄存器的个数、位数、编号和功能存储地址空间大小、编址方式、大/小端指令寻址方式