嵌入式操作系统 陈香兰 xlanchen@ustc.edu.cn http://staff.ustc.edu.cn/~xlanchen Spring 2008 中国科学技术大学计算机系
Embedded Operating Systems 关于以后的课程安排 每个组(共23组)至少一次派代表到课堂上讲与源码分析或者上机实践相关的内容,同一种操作系统各组不得重复 内容必须与某次课程内容相关,使用ppt,也可上机演示(自带环境) 时间长度15分钟左右 作为project 3打分 在剩下的7次课的时间里 每次2~3组 最后一次课最多6组(注意不能重复) xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 本次课将检查各组的进展情况 依据bbs上各操作系统的project1和project2 各组(共21组)派代表汇报情况 Rtems各组(2组) uCLinux各组(5组) uC/OS-II各组(2组) WinCE各组(4组) armLinux各组(4组) RTLinux/RTAI各组(4组) xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 前四周(1) 课程简介 嵌入式系统及其软件开发概述 嵌入式系统基本概念 嵌入式硬件的发展 嵌入式软件及其开发 嵌入式操作系统及系统开发 典型嵌入式操作系统介绍 嵌入式操作系统选型 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 前四周(2) GNU开发工具链介绍 GNU Tools简介 GCC、 binutils、 Gdb、 make、ld GNU Tools交叉开发环境及其安装 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 前四周(3) SkyEye介绍 SkyEye简介 SkyEye的安装和使用 操作系统关键指标对应用性能的影响 操作系统关键指标 嵌入式实时操作系统性能测试方法 嵌入式操作系统研究简介(部分举例) 嵌入式操作系统的多样性 嵌入式内存扩容技术举例 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 前四周(4) Boot Loader Boot Loader 的概念 Boot Loader 的主要任务 Boot Loader 的框架结构 Boot Loader 的安装 部分开源的boot loader xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 前四周(5) 嵌入式Linux开发技术 嵌入式Linux开发综述 Linux的配置和编译 根文件系统及其制作 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 前四周(6) 基于i386体系结构的Linux启动代码分析 linux/arch/i386/boot/bootsect.S linux/arch/i386/boot/setup.S linux/arch/i386/boot/compressed/head.S linux/arch/i386/kernel/head.S linux/arch/init/main.c xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 本次课 基于i386体系结构的Linux操作系统内核分析 一些基本概念 堆栈 用户态/内核态 虚拟内存 xlanchen@2008.4.8 Embedded Operating Systems
基于i386体系结构的 Linux内核分析: 一些预备知识
Embedded Operating Systems 声明 本课内容涉及到的Linux的内核分析,是基于Linux2.4.18内核源代码的,具有一定的典型性,但不一定适用于所有其他的Linux内核版本 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 操作系统的基本概念 任何计算机系统都包含一个基本的程序集合,称为操作系统。 内核(进程管理,进程调度,进程间通讯机制,内存管理,中断异常处理,文件系统,I/O系统,网络部分) 其他程序(例如函数库,shell程序等等) 操作系统的目的 与硬件交互,管理所有的硬件资源 为用户程序(应用程序)提供一个良好的执行环境 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 一个典型的Linux操作系统的结构 用户应用程序 Shell,lib System call Kernel implementation 对硬件资源的管理 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 最简单也是最复杂的操作 在控制台下输入ls命令 为什么我们敲击键盘就会在终端上显示? 中断的概念,终端控制台设备驱动的概念 Shell程序分析输入参数,确定这是ls命令 保护模式和实模式,内存保护,内核态用户态相关问题 什么是系统调用? 调用系统调用fork生成一个shell本身的拷贝 软中断、异常的概念。陷阱门,系统门 系统调用是怎么实现的? 进程的描述,进程的创建。COW技术 fork是什么? 为什么要调用fork? 内存管理模块,进程的地址空间,分页机制,文件系统 调用exec系统调用将ls的可执行文件装入内存 堆栈的维护,寄存器的保存与恢复 如何做到正确的返回? 从系统调用返回 进程的调度,运行队列等待队列的维护 Shell和ls都得以执行 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 一些基本但很重要的概念 堆栈 内核态 vs 用户态 虚拟内存 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 堆栈 堆栈是C语言程序运行时必须的一个记录调用路径和参数的空间 函数调用框架 传递参数 保存返回地址 提供局部变量空间 等等 C语言编译器对堆栈的使用有一套的规则 了解堆栈存在的目的和编译器对堆栈使用的规则是理解操作系统一些关键性代码的基础 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 堆栈寄存器和堆栈操作 低地址 堆栈相关的寄存器 esp,堆栈指针(stack pointer) ebp,基址指针(base pointer) 堆栈操作 push 栈顶地址减少4个字节(32位) pop 栈顶地址增加4个字节 ebp在C语言中用作记录当前函数调用基址 esp esp ebp 高地址 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 利用堆栈实现函数调用和返回 其他关键寄存器 cs : eip:总是指向下一条的指令地址 顺序执行:总是指向地址连续的下一条指令 跳转/分支:执行这样的指令的时候,cs : eip的值会根据程序需要被修改 call:将当前cs : eip的值压入栈顶,cs : eip指向被调用函数的入口地址 ret:从栈顶弹出原来保存在这里的cs : eip的值,放入cs : eip中 发生中断时??? ???? xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems //建立被调用者函数的堆栈框架 pushl %ebp movl %esp, %ebp //拆除被调用者函数的堆栈框架 movl %ebp,%esp popl %ebp ret // 调用者 … call target //被调用者函数体 //do sth. … call指令: 1)将下一条指令的地址A保存在栈顶 2)设置eip指向被调用程序代码开始处 将地址A恢复到eip中 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 函数堆栈框架的形成 esp call xxx 执行call之前 执行call时,cs : eip原来的值 指向call下一条指令,该值被 保存到栈顶,然后cs : eip的值 指向xxx的入口地址 进入xxx 第一条指令: pushl %ebp 第二条指令: movl %esp, %ebp 函数体中的常规操作,可能会压栈、出栈 退出xxx movl %ebp,%esp popl %ebp ret ebp 低地址 esp ebp esp cs : eip esp ebp 高地址 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems C语言中还使用堆栈进行 参数的传递 局部变量的使用 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 一段小程序 源文件:test.c 这是一个很简单的C程序 main函数中调用了函数p1和p2 首先使用gcc生成test.c的可执行文件test 然后使用objdump –S获得test的反汇编文件 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 从test的反汇编文件中找到p2的反汇编代码 int p2(int x,int y) { push %ebp mov %esp,%ebp return x+y; mov 0xc(%ebp),%eax add 0x8(%ebp),%eax } pop %ebp ret 建立框架 低地址 ebp esp ebp esp 调用者 堆栈 框架 x y 拆除框架 ebp xlanchen@2008.4.8 Embedded Operating Systems 高地址
Embedded Operating Systems 观察main函数是如何传递参数给p2的 esp 被调用者 堆栈 框架 … z=p2(x,y); pushl 0xfffffff8(%ebp) pushl 0xfffffff4(%ebp) call 804839b <p2> add $0x8,%esp mov %eax,0xfffffffc(%ebp) printf("%d=%d+%d\n",z,x,y); pushl 0xfffffffc(%ebp) push $0x8048510 call 80482b0 <printf@plt> ebp ebp 低地址 cs:eip esp x的值 esp y的值 esp 调用者 堆栈 框架 ebp 高地址 p2的返回值是如何返回给main的? xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 观察main中的局部变量 int main(void) { push %ebp mov %esp,%ebp sub $0x18,%esp … char c='a'; movb $0x61,0xfffffff3(%ebp) int x,y,z; x=1; movl $0x1,0xfffffff4(%ebp) y=2; movl $0x2,0xfffffff8(%ebp) 低地址 esp c=‘a’ x=1 y=2 ebp esp ebp esp 调用者 ebp 高地址 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 观察程序运行时堆栈的变化 eip p1 p1 eip p2 p2 esp p1的堆栈 p2堆栈 eip main … p1(c) p2(x,y) eip eip eip eip eip main c x,y esp eip main堆栈 eip eip eip eip 堆栈 程序的代码段 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 另一段小程序 和前一段小程序稍有不同 在这个小程序中,main函数中调用了函数p2,而在p2的执行过程中又调用了函数p1 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 观察程序运行时堆栈的变化 eip p1 p1 esp p1堆栈 eip p2 … p1(c) eip eip eip p2 eip c esp eip p2堆栈 eip eip main … p2(x,y) eip x,y esp eip eip main main堆栈 eip 堆栈 程序的代码段 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 观察堆栈的手动初始化 bootsect.S中第一次对堆栈的初始化 在compressed/head.S中将堆栈初始化到stack_start上 在kernel/head.S中2次将堆栈初始化到stack_start上 在汇编代码中,调用C函数,要确定是从寄存器传递参数还是从堆栈传递参数 若堆栈,则要按照正确的顺序准备,例如在compressed/head.S中,调用解压缩C程序decompress_kernel时 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 观察堆栈在内核中的使用 在内核代码中经常有这样的函数,它的参数是struct pt_regs *regs 可以往回一层层的寻找这个参数是怎么传递过来的,最后我们可以发现最源头的函数使用了这样的参数struct pt_regs regs 比如void do_IRQ(struct pt_regs regs) 如果再进一步寻找是谁调用了这个do_IRQ,我们会发现只是一条简单的汇编语句 call do_IRQ xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 为什么要有pt_regs结构 用户态 vs 内核态 寄存器上下文 从用户态切换到内核态时 必须保存用户态的寄存器上下文 要保存哪些? 保存在哪里? 中断/int指令会在堆栈上保存一些寄存器的值 如:用户态栈顶地址、当时的状态字、当时的cs:eip的值 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems pt_regs结构 xlanchen@2008.4.8 Embedded Operating Systems
SAVE_ALL和RESTORE_ALL xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems do_IRQ的调用方式 仔细阅读一下与之相连的汇编码 pushl $n-256 SAVE_ALL call do_IRQ jmp ret_from_intr xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems do_IRQ的函数定义方式 因此,do_IRQ将栈顶的内容看成pt_regs 结构的参数,在必要时可以通过访问这里 的内容获得信息 regparm(x) x!=0:告诉gcc不通过堆栈而通过寄存器传。 x是参数个数,寄存器依此使用EAX,EDX,ECX… 而asmlinkage则使得编译器不通过寄存器(x=0)而 使用堆栈传递参数 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 用户态和内核态的概念 Why? 假定不区分 用户直接修改操作系统的数据 用户直接调用操作系统的内部函数 用户直接操作外设 用户任意读/写物理内存 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 因此,要区分用户态和内核态: 禁止用户程序和底层硬件直接打交道 (最简单的例子,如果用户程序往硬件控制寄存器写入不恰当的值,可能导致硬件无法正常工作) 禁止用户程序访问任意的物理内存 (否则可能会破坏其他程序的正常执行,如果对核心内核所在的地址空间写入数据的话,会导致系统崩溃) 注意:有些简单的嵌入式操作系统不区分用户态和内核态,所有的应用都运行在内核态中 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 什么是用户态和内核态? 一般现代CPU都有几种不同的指令执行级别 在高执行级别下,代码可以执行特权指令,访问任意的物理地址,这种CPU执行级别就对应着内核态 而在相应的低级别执行状态下,代码的掌控范围会受到限制。只能在对应级别允许的范围内活动 举例: intel x86 CPU有四种不同的执行级别0-3,Linux只使用了其中的0级和3级分别来表示内核态和用户态 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 如何区分一段代码是核心态还是用户态 cs寄存器的最低两位表明了当前代码的特权级 CPU每条指令的读取都是通过cs:eip这两个寄存器: 其中cs是代码段选择寄存器,eip是偏移量寄存器。 上述判断由硬件完成 一般来说在Linux中,地址空间是一个显著的标志:0xc0000000以上的地址空间只能在内核态下访问,0x00000000-0xbfffffff的地址空间在两种状态下都可以访问 注意:这里所说的地址空间是逻辑地址而不是物理地址 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 虚拟内存 物理内存有限,是一种稀缺资源 局部性原理 空间局部性 时间局部性 按需调页 页框 利用磁盘上的交换空间 注意:大多数嵌入式操作系统不采用虚拟内存的概念 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 进程的虚拟地址空间 独立的地址空间(32位,4GB),每个进程一个 在Linux中,3G以上是内核空间,3G以下是用户空间 4G的进程地址空间使用进程私有的二级页表进行地址转换(虚拟地址物理地址) 页面大小:4KB 页目录、页表 若对应的内容在内存中,则对应的二级页表项记录相应的物理页框信息 否则根据需要进行装载或者出错处理 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 进程调度后,执行一个新的被调度的进程之前,要先进行页表切换 Linux中的内核空间 每个进程3G以上的空间用作内核空间 从用户地址空间进入内核地址空间不经过页表切换 而是通过中断/异常/系统调用入口(也只能如此) xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 站在CPU执行指令的角度 idle wait keyborad queue 进程x 系统调用处理 eip esp cs ds等等 进程管理 CPU Wakeup progress 中断处理 内核其他模块 esp esp 0xc0000000 idtr eip intr some action 8259 c=gets() … esp main keyboard 进程x xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 从内存的角度来看 0xffffffff 0xe0000000 在Linux中,物理内存 总是被映射在3G以上 的空间中, 若物理内存过大,需 使用其他的映射技术 0x20000000 (512M) 0xc0000000 (3G) 用户代码或数据 0x00400000 内核代码 内核静态数据 0x00000000 0x00000000 物理内存 虚拟空间 xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems 作业5: C语言中堆栈的作用是什么?在你阅读的操作系统中,找到非i386体系结构的启动代码,寻找堆栈的初始化和调用C代码前堆栈的准备代码。 为什么要有内核态与用户态的区别?在嵌入式操作系统中,应用程序和操作系统同时运行在内核态,有什么好处和坏处? xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems Rtems各组(2组) (1)USTC(4人) ;(2)008(4人) 1,RTEMS简介 2,下载到源代码 3,目录结构分析 4,makefile分析 5,链接描述文件分析 6,初始化过程分析 7,建立开发环境 8,模块分析并形成ppt xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems uCLinux各组(5组) (1)N3608(4人); (2)NB(4人) (3)CWY(4人); (4)322(4人) (5)XI(3人) 1,uCLinux简介ppt 2,下载到源代码 3,目录结构分析 4,makefile分析 5,链接描述文件 6,初始化过程 7,建立开发环境 8,模块分析并形成ppt xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems uC/OS-II各组(2组) (1)888(3人);(2)Group01(3人) 1,uC/OS-II简介ppt 2,下载到源代码 3,目录结构分析 4,makefile分析 5,链接描述文件 6,初始化过程 7,建立开发环境 8,模块分析并形成ppt xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems WinCE各组(4组) (1)AK(4人); (2)007(4人) (3)TDI(3人); (4)666(3人) 1,WinCE简介ppt 2,下载到源代码 3,目录结构分析 4,makefile分析 5,链接描述文件 6,初始化过程 7,建立开发环境 8,模块分析并形成ppt xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems armLinux各组(4组) (1)X-Men(4人); (2)hzlc(4人) (3)MYTH(4人); (4)clhz(4人) 1,armLinux简介ppt 2,下载到源代码 3,目录结构分析 4,makefile分析 5,链接描述文件 6,初始化过程 7,建立开发环境 8,模块分析并形成ppt xlanchen@2008.4.8 Embedded Operating Systems
Embedded Operating Systems RTLinux/RTAI各组(4组) (1)VIG(4人); (2)Girls (4人) (3)LCK(4人); (4)MARS(4人) 1,uCLinux简介ppt 2,下载到源代码 3,目录结构分析 4,makefile分析 5,链接描述文件 6,初始化过程 7,建立开发环境 8,模块分析并形成ppt xlanchen@2008.4.8 Embedded Operating Systems