Download presentation
Presentation is loading. Please wait.
1
操作系统原理相关基础知识 Basic knowledge of Operating Systems Principles based on X86/Linux
孟宁 电话: 主页: 地址:苏州工业园区独墅湖高等教育区仁爱路166号明德楼A302室 2012年2月
2
Agenda 操作系统的基本概念 典型的Linux操作系统的结构 最简单也是最复杂的操作 堆栈 用户态 vs 内核态 虚拟内存
3
操作系统的基本概念 任何计算机系统都包含一个基本的程序集合,称为操作系统。 操作系统的目的
内核(进程管理,进程调度,进程间通讯机制,内存管理,中断异常处理,文件系统,I/O系统,网络部分) 其他程序(例如函数库、shell程序、系统程序等等) 操作系统的目的 与硬件交互,管理所有的硬件资源 为用户程序(应用程序)提供一个良好的执行环境
4
典型的Linux操作系统的结构 用户应用程序 Shell,lib System call Kernel implementation
对硬件资源的管理
5
最简单也是最复杂的操作 在控制台下输入ls命令 Shell程序分析输入参数,确定这是ls命令
为什么我们敲击键盘就会在终端上显示? 中断的概念,终端控制台设备驱动的概念 Shell程序分析输入参数,确定这是ls命令 终端解释程序 什么是shell? 保护模式和实模式,内存保护,内核态用户态相关问题 什么是系统调用? 调用系统调用fork生成一个shell本身的拷贝 软中断、异常的概念。陷阱门,系统门 系统调用是怎么实现的? 进程的描述,进程的创建。COW技术 fork是什么? 为什么要调用fork? 调用exec系统调用将ls的可执行文件装入内存 内存管理模块,进程的地址空间,分页机制,文件系统 堆栈的维护,寄存器的保存与恢复 从系统调用返回 如何做到正确的返回? 进程的调度,运行队列等待队列的维护 Shell和ls都得以执行
6
堆栈 堆栈是C语言程序运行时必须的一个记录调用路径和参数的空间 C语言编译器对堆栈的使用有一套的规则
函数调用框架 传递参数 保存返回地址 提供局部变量空间 等等 C语言编译器对堆栈的使用有一套的规则 了解堆栈存在的目的和编译器对堆栈使用的规则是理解操作系统一些关键性代码的基础
7
堆栈寄存器和堆栈操作 堆栈相关的寄存器 堆栈操作 ebp在C语言中用作记录当前函数调用基址 esp,堆栈指针(stack pointer)
ebp,基址指针(base pointer) 堆栈操作 push 栈顶地址减少4个字节(32位) pop 栈顶地址增加4个字节 ebp在C语言中用作记录当前函数调用基址 低地址 esp esp ebp 高地址
8
利用堆栈实现函数调用和返回 其他关键寄存器 cs : eip:总是指向下一条的指令地址 顺序执行:总是指向地址连续的下一条指令
call:将当前cs : eip的值压入栈顶,cs : eip指向被调用函数的入口地址 ret:从栈顶弹出原来保存在这里的cs : eip的值,放入cs : eip中 发生中断时?
9
函数的堆栈框架 //建立被调用者函数的堆栈框架 pushl %ebp movl %esp, %ebp // 调用者
//拆除被调用者函数的堆栈框架 movl %ebp,%esp popl %ebp ret // 调用者 … call target //被调用者函数体 //do sth. … call指令: 1)将下一条指令的地址A保存在栈顶 2)设置eip指向被调用程序代码开始处 将地址A恢复到eip中
10
函数堆栈框架的形成 call xxx 进入xxx 退出xxx 执行call之前
执行call时,cs : eip原来的值 指向call下一条指令,该值被 保存到栈顶,然后cs : eip的值 指向xxx的入口地址 进入xxx 第一条指令: pushl %ebp 第二条指令: movl %esp, %ebp 函数体中的常规操作,可能会压栈、出栈 退出xxx movl %ebp,%esp popl %ebp ret esp ebp 低地址 esp ebp esp cs : eip esp ebp 高地址
11
一段小程序 源文件:test.c 这是一个很简单的C程序 main函数中调用了函数p1和p2
首先使用gcc –g 生成test.c的可执行文件test 然后使用objdump –S获得test的反汇编文件
12
观察p2的堆栈框架 从test的反汇编文件中找到p2的反汇编代码 int p2(int x,int y) { push %ebp
mov %esp,%ebp return x+y; mov 0xc(%ebp),%eax add 0x8(%ebp),%eax } pop %ebp ret 建立框架 低地址 ebp esp ebp esp 调用者 堆栈 框架 x 拆除框架 y ebp 高地址
13
如何传递参数给p2的 esp 被调用者 堆栈 框架 ebp ebp 低地址 cs:eip esp x的值 esp y的值 esp 调用者
… z=p2(x,y); pushl 0xfffffff8(%ebp) pushl 0xfffffff4(%ebp) call b <p2> add $0x8,%esp mov %eax,0xfffffffc(%ebp) printf("%d=%d+%d\n",z,x,y); pushl 0xfffffffc(%ebp) push $0x call b0 被调用者 堆栈 框架 ebp ebp 低地址 cs:eip esp x的值 esp y的值 esp 调用者 堆栈 框架 ebp 高地址 p2的返回值是如何返回给main的?
14
观察main中的局部变量 int main(void) { push %ebp mov %esp,%ebp sub $0x18,%esp …
char c='a'; movb $0x61,0xfffffff3(%ebp) int x,y,z; x=1; movl $0x1,0xfffffff4(%ebp) y=2; movl $0x2,0xfffffff8(%ebp) 低地址 esp c=‘a’ x=1 y=2 ebp esp ebp esp 调用者 ebp 高地址
15
观察程序运行时堆栈的变化 eip eip esp p1的堆栈 p2堆栈 eip eip eip eip eip c eip esp x,y
main … p1(c) p2(x,y) eip eip eip eip main c eip esp x,y eip main堆栈 eip eip eip eip 堆栈 程序的代码段
16
三级函数调用程序 在这个小程序中,main函数中调用了函数p2,而在p2的执行过程中又调用了函数p1
17
观察程序运行时堆栈的变化 eip esp p1堆栈 eip eip eip eip eip c esp eip p2堆栈 eip eip
… p1(c) eip eip eip p2 eip c esp eip p2堆栈 eip eip main … p2(x,y) eip x,y esp eip eip main main堆栈 eip 堆栈 程序的代码段
18
什么是用户态和内核态? 一般现代CPU都有几种不同的指令执行级别
而在相应的低级别执行状态下,代码的掌控范围会受到限制。只能在对应级别允许的范围内活动 举例: intel x86 CPU有四种不同的执行级别0-3,Linux只使用了其中的0级和3级分别来表示内核态和用户态
19
如何区分用户态和内核态? cs寄存器的最低两位表明了当前代码的特权级
CPU每条指令的读取都是通过cs:eip这两个寄存器: 其中cs是代码段选择寄存器,eip是偏移量寄存器。 上述判断由硬件完成 一般来说在Linux中,地址空间是一个显著的标志:0xc 以上的地址空间只能在内核态下访问,0x -0xbfffffff的地址空间在两种状态下都可以访问 注意:这里所说的地址空间是逻辑地址而不是物理地址
20
用户态 vs 内核态 寄存器上下文 中断/int指令会在堆栈上保存一些寄存器的值 从用户态切换到内核态时
必须保存用户态的寄存器上下文 要保存哪些? 保存在哪里? 中断/int指令会在堆栈上保存一些寄存器的值 如:用户态栈顶地址、当时的状态字、当时的cs:eip的值
21
保护现场和恢复现场
22
虚拟内存 物理内存有限,是一种稀缺资源 局部性原理 空间局部性 时间局部性 按需调页 页框 利用磁盘上的交换空间
23
进程的虚拟地址空间 独立的地址空间(32位,4GB),每个进程一个 在Linux中,3G以上是内核空间,3G以下是用户空间
页面大小:4KB 页目录、页表 若对应的内容在内存中,则对应的二级页表项记录相应的物理页框信息 否则根据需要进行装载或者出错处理 进程调度后,执行一个新的被调度的进程之前,要先进行页表切换
24
Linux中的内核空间 每个进程3G以上的空间用作内核空间 从用户地址空间进入内核地址空间不经过页表切换
而是通过中断/异常/系统调用入口(也只能如此)
25
站在CPU执行指令的角度 CPU idle wait keyborad queue 进程x 系统调用处理 eip esp cs ds等等
进程管理 Wakeup progress esp 中断处理 idtr eip 内核其他模块 esp intr 0xc 8259 some action c=gets() … esp keyboard main 进程x
26
从内存的角度来看 0xffffffff 0xe0000000 0x20000000 (512M) 0xc0000000 (3G)
在Linux中,物理内存 总是被映射在3G以上 的空间中, 若物理内存过大,需 使用其他的映射技术 0x (512M) 0xc (3G) 用户代码或数据 0x 内核代码 内核静态数据 0x 0x 物理内存 虚拟空间
27
Homework C语言中堆栈的作用是什么?请使用一个实例说明C语言中堆栈的某一个作用。
为什么要有内核态与用户态的区别?请结合32位x86说明在Linux中,用户态与内核态有哪些区别?在什么情况下,系统会进入内核态执行?
28
“有两种生成一个软件设计方案的途径:一个是把它做得如此简单,以致于明显不会有漏洞存在。另一个是把它做的如此复杂,以致于不会有明显的漏洞存在。”——Tony Hoare
谢谢大家! 参考资料: 《深入理解Linux内核》第三版
Similar presentations