中国科学技术大学计算机系 陈香兰(0551-3606864) xlanchen@ustc.edu.cn Spring 2009 Linux内核源代码导读 中国科学技术大学计算机系 陈香兰(0551-3606864) xlanchen@ustc.edu.cn Spring 2009
进程地址空间 进程地址空间和内存描述符 线性区 创建和删除线性区 创建和删除进程的地址空间 缺页处理 堆 2019/7/24 Linux操作系统源代码分析导读
内核态和用户态分配内存的不同 内核中的函数以直接了当的方式获得动态内存 给用户态进程分配内存时 内核是操作系统中优先级最高的成分。 内核信任自己 采用前面介绍的页面级内存分配和小内存分配以及非连续线性区 给用户态进程分配内存时 请求被认为是不紧迫的 用户进程不可信任 因此,当用户态进程请求动态内存时,并没有立即获得实际的物理页框,而仅仅获得对一个新的线性地址区间的使用权 这个线性地址区间会成为进程地址空间的一部分,称作线性区(memory areas) 2019/7/24 Linux操作系统源代码分析导读
进程地址空间 进程最多能访问4GB的线性地址空间 但进程在访问某个线性空间之前,必须获得该线性空间的许可 因此,一个进程的地址空间是由允许该进程访问的全部线性地址组成 内核使用线性区资源来表示线性地址空间 每个线性区由起始线性地址、长度和一些存取权限描述 2019/7/24 Linux操作系统源代码分析导读
与进程地址空间相关的描述符 mm_struct 2019/7/24 Linux操作系统源代码分析导读
线性区的开始和结束都必须4KB对齐 进程获得新线性区的一些典型情况: 刚刚创建的新进程 使用exec系统调用装载一个新的程序运行 将一个文件(或部分)映射到进程地址空间中 当用户堆栈不够用的时候,扩展堆栈对应的线性区 …… 2019/7/24 Linux操作系统源代码分析导读
与创建、删除地址空间和线性区相关的系统调用 brk( ) 改变进程堆的大小 execve( ) Loads a new executable file, thus changing the process address space _exit( ) Terminates the current process and destroys its address space fork( ) Creates a new process, and thus a new address space mmap( ) Creates a memory mapping for a file, mmap2( ) thus enlarging the process address space mremap( ) 扩大或缩小线性区 remap_file_pages( ) Creates a non-linear mapping for a file munmap( ) Destroys a memory mapping for a file, thus contracting the process address space shmat( ) Attaches a shared memory region shmdt( ) Detaches a shared memory region 2019/7/24 Linux操作系统源代码分析导读
线性区(memory area) 比如0x08048000——0x0804C000这段线性地址空间被分配给了一个进程,进程就可以访问这段地址空间 进程只能访问某个有效的memory area。进一步讲,这个area可以被标志为只读或者不可执行(nonexecutable) 如果进程试图访问一个有效的area之外的地址或者用不正确的方式访问一个有效的area,内核将通过段异常(segmentation fault)杀死这个进程 2019/7/24 Linux操作系统源代码分析导读
线性区中可以包含各种内容 可执行文件代码段的内存映射,就是.text section 数据段的内存映射,.data section zero page的内存映射用来包含未初始化的全局变量,.bss section 为库函数和链接器附加的代码、数据、bss段 文件的内存映射 共享内存的映射 匿名内存区域的映射,比如通过malloc()函数申请的内存区域 2019/7/24 Linux操作系统源代码分析导读
进程地址空间中所有有效的线性地址都确定的存在于一个area中 memory areas不重叠 进程中每个单独的area对应一个不同内存区: 堆栈、二进制代码、全局变量、文件映射等等 2019/7/24 Linux操作系统源代码分析导读
增加或删除一个线性区 2019/7/24 Linux操作系统源代码分析导读
task_struct中的地址空间描述符mm_struct 部分参考ULK3中文版354页 参见Linux2.6.26源代码 2019/7/24 Linux操作系统源代码分析导读
分配一个内存描述符(创建进程地址空间) copy_mm函数用来在fork()调用中从父进程拷贝内存描述符 其中间接使用mm_alloc_pgd来分配一个新的页表 而mm_struct数据结构本身的空间是从mm_cachep指向的slab缓存中通过allocate_mm()宏分配得到的 如果父进程在fork()创建子进程时,通过一些标志指明要和子进程共享地址空间。那么,只需要 2019/7/24 Linux操作系统源代码分析导读
释放一个内存描述符(删除进程地址空间) 在进程退出时,exit_mm()函数被调用 首先做一些清除工作,更新一些内核全局统计数据 接着调用mmput(),这个函数减mm的mm_users域 如果mm_users域变成了0,就调用mmdrop()函数来减mm_count域 在mmdrop中,如果mm_count域变成了0,就调用__mmdrop free_mm()宏调用kmem_cache_free()函数把mm_struct返还给mm_cachp指向slab缓存 2019/7/24 Linux操作系统源代码分析导读
地址空间切换 switch_mm用来进行地址空间切换,包括 清除和设置prev和next地址空间中当前CPU在CPU位图的对应位; 使用next的页目录装载CR3; 装载next的LDT。 观察switch_mm,不考虑CONFIG_SMP 2019/7/24 Linux操作系统源代码分析导读
关于内核线程的地址空间 内核线程总是使用一组最近运行的普通进程的页表 高于3G的线性地址空间的特殊性 关于task_struct中“拥有”的mm和“使用的”active_mm 高于3G的页表的一致性维护 延迟更新 2019/7/24 Linux操作系统源代码分析导读
线性区(memory areas) 每个线性区由一个vm_area_struct结构来表示 这个结构描述了一段给定的内存区间 区间中的地址都有同样的属性,比如同样的存取权限和相关的操作函数 用这个结构可以表示各种线性区,比如映射可执行的二进制代码的线形区、用作用户态堆栈的线形区等等 参见源码中的vma_area_struct 2019/7/24 Linux操作系统源代码分析导读
线性区的存取权限 vm_flags域描述有关这个线性区全部页的信息。例如,进程访问每个页的权限是什么。还有一些标志描述线性区自身,例如它应该如何增长 VM_READ, VM_WRITE, VM_EXEC VM_SHARED VM_RESERVED VM_GROWSUP 更多,参见ULK3 363页 2019/7/24 Linux操作系统源代码分析导读
线性区的链表和红黑树 通过内存描述符中的两个域mmap和mm_rb都可以访问线性区。事实上,它们都指向了同一个vm_area_struct结构,只是链接的方式不同 mmap指向的线性区链表用来遍历整个进程的地址空间 红黑树mm_rb用来定位一个给定的线性地址落在进程地址空间中的哪一个线性区中 mmap_cache用来缓存最近用过的线性区 2019/7/24 Linux操作系统源代码分析导读
处理线性区 内核进程需要对一个线性区进行处理,比如确定一个给定线性地址是否存在于一个线性地址空间中 find_vma(),查找一个线性地址所属或后继线性区 两个参数:进程内存描述符的地址mm和线性地址addr find_vma_intersection(),查找一个与给定地址区间重叠的线性区 get_unmapped_area(),查找一个空闲的地址区间 insert_vm_struct(),向内存描述符链表中插入一个线性区 2019/7/24 Linux操作系统源代码分析导读
static inline unsigned long do_mmap 创建一个线性区间 do_mmap(),创建一个线性区 根据file参数映射指定的文件中偏移量为offset,长度为len的一段内容 addr参数指明从何处开始查找一段可用的空闲线性地址区间 Prot参数指定这个区间所包含的页的存取权限 flags参数指定这个创建的线性区本身的一些标志 static inline unsigned long do_mmap (struct file *file, unsigned long addr, unsigned long len, unsigned long prot, unsigned long flag, unsigned long offset) 2019/7/24 Linux操作系统源代码分析导读
删除一个线性区间 munmap()和do_munmap() do_munmap()函数从进程地址空间中删除一段线性空间 mm参数指向了当前进程的内存描述符 addr参数为线性区的起始地址 len参数指明要删除的区间大小 int do_munmap (struct mm_struct *mm, unsigned long addr, size_t len) 2019/7/24 Linux操作系统源代码分析导读
缺页异常 如前所述,内核只是通过mmap()等调用分配了一些线性地址空间给进程,并没有真正的把实际的物理页框分配给进程 当进程试图访问这些分配给它的地址空间时,比如一段线性地址空间映射的是二进制代码,则进程被调度执行的时候会跳转到这个地址上去执行 此时,并没有物理页框对应于这些线性地址,从而会引发一个缺页异常 2019/7/24 Linux操作系统源代码分析导读
缺页异常处理程序do_page_fault 缺页异常处理程序处理缺页异常。 它可以判断出这是不是一个合法的缺页异常,如果是,则负责给这段线性地址分配一些物理页框并把磁盘中对应的文件写入这些物理页框 这样进程得以正常运行。 阅读相关代码 trap_init、page_fault、do_page_fault do_page_fault中,根据不同的情况分别进行处理 vmalloc_fault 异常表及处理 堆栈扩展 其它用户线性区的处理 … 2019/7/24 Linux操作系统源代码分析导读
常规缺页相关的概念 按需调页 写时复制 2019/7/24 Linux操作系统源代码分析导读
堆 堆用来满足用户进程的动态内存请求 其线性区间地址范围在mm_struct中由start_brk和brk标识 用户请求分配/释放动态内存 malloc(size) cmalloc(n,size) realloc(ptr,size) free(addr) brk(addr)和sbrk(adr) 只有brk有相关的系统调用,其它都仅仅是C库函数,可能调用brk和mmap sys_brk 2019/7/24 Linux操作系统源代码分析导读
Project 这个作业的代码不在Linux内核中。请自己寻找 查找glibC库中关于malloc和free接口相关的定义,调研malloc中所使用的地址空间管理算法。 2019/7/24 Linux操作系统源代码分析导读
Thanks! The end.