Unix/Linux内存管理
一、底层结构
采用三层结构,实际使用中可以方便映射到两层或者三层结构,以适用不同的硬件结构。最下层的申请内存函数get_free_page。之上有三种类型的内存分配函数:
1.kmalloc类型。内核进程使用,基于切片(slab)技术,用于管理小于内存页的内存申请。思想出发点和应用层的内存缓冲池同出一辙。但它针对内核结构,特别处理应用场景固定,不考虑释放。
2.vmalloc类型。内核进程使用。用于申请不连续内存。
3.brk/mmap类型。用户进程使用。malloc/free实现的基础。
二、内存管理的相关函数图
STL -> 内存自动分配和自动回收(C++)
|
C++ -> new分配内存,delete回收内存
|
C -> malloc分配内存,free回收内存
|
Unix 系统函数 -> sbrk/brk 分配和回收内存
|
Unix底层系统函数 -> mmap/munmap分配回收
(用户层)
----------------------------------------------------------------------------
(内核层)
Unix内核函数 kmalloc/vmalloc/get_free_page
三、进程与内存
a.所有进程(执行的程序)都必须占用一定数量的内存
b.对任何一个普通进程来讲,它都会涉及到5种不同的数据段,其内存空间划分为:
1.代码区 —— 存放代码/函数,也就是说它是可执行程序的内存中的镜像。(只读)
2.全局区 —— 保存全局变量,static局部变量。
3.BSS段 —— 未初始化的全局变量,BSS段在main函数执行之前会自动清零
4.栈区 —— 局部变量,包括函数的形参,栈区内存自动分配和自动回收。
5.堆区 —— 程序员自己管理的区域,malloc/free操作的都是堆区。
6.只读常量区 —— 存放字符串常量和const修饰的全局变量
注:只读常量区和代码区非常接近,有些书把只读常量区和代码区合并为代码区。
c.进程如何组织这些区域?
从小到大次序:代码区、只读常量区、全局区、BSS段、堆区、栈区
堆区在离前面四个区不远的地址空间开始,从小到大分配,栈区从3G开始,从大到小分配。主要为了避免堆区和栈区重叠。
d.查看内存分配
Linux把一切都看做成文件,内存也可以在文件中查看。每个进程都在/proc目录下有一个对应的子目录,以进程ID作为子目录名。进程ID是系统对进程的标识。可以用ps-aux命令查看进程。
cat /proc/进程ID/maps 可以查看当前进程的内存情况。
四、虚拟内存管理技术
Linux使用了虚拟内存地址。每个Linux中的进程都有 0~4G的虚拟内存地址,就是0~4G的数字。虚拟内存地址在开始时只是一个数字,不对应任何的内存。虚拟内存地址必须先映射一段物理内存或硬盘上的文件才能被使用。所谓的分配内存其实就是让虚拟内存地址映射一段物理内存。如果使用没有映射的虚拟内存地址就会引发段错误。
程序员所操作的内存地址都是虚拟内存地址,看不到物理内存地址。
0~4G的虚拟内存地址中,0~3G是用户使用,叫做“用户空间”,3G~4G是内核使用的,叫做“内核空间”。用户空间不能直接使用内核空间,但可以通过内核空间提供的一些函数(系统调用)访问内核空间。
注:内存管理的基本单位是4096 byte (4K),叫内存页。内存的映射和回收都是以内存页作为基本单位。
五、进程内存管理
进程内存管理的对象是进程线性地址空间上的内存镜像,这些内存镜像其实就是进程使用的虚拟内存区域(memory region)。进程虚拟空间是个32或64位的“平坦”(独立的连续区间)地址空间(空间的具体大小取决于体系结构)。要统一管理这么大的平坦空间可绝非易事,为了方便管理,虚拟空间被划分为许多大小可变的(但必须是4096byte的整数倍数)内存区域,这些区域在进程线性地址中像停车位一样有序排列。这些区域的划分原则是“将访问属性一致的地址空间存放在一起”,所谓访问属性一致无非是指“可读、可写、可执行等”。
六、物理内存管理(页管理)
Linux内核管理物理内存是通过分页机制实现的,它将整个内存划分成无数4K(在i386体系结构中)大小页,从而分配和回收内存的基本单位便是内存页了。利用分页管利用助于灵活分配内存地址,因为分配时不必要求必须有大块的连续内存,系统可以东一页、西一页的凑出所需要的内存供进程使用。虽然如此,但是实际上系统使用内存还是倾向于分配连续的内存块,因为分配连续内存时,页表不需要修改,因此能降低刷新率(频繁刷新会很大增加访问速度)。
七、brk/sbrk的虚拟内存管理
void *sbrk(int size);
size = 0 返回sbrk/brk上次的末尾地址,代表取当前的位置,
size > 0 分配内存空间,返回上次的末尾地址,代表分配size字节的内存,
size < 0 释放空间,代表回收size字节内存。
int brk(void* ptr);
直接修改访问的有效范围的末尾地址,释放空间形成一个完整的page,则该页映射被解除
返回:0 分配成功
-1 分配失败
经验:sbrk在分配内存上简单,brk在释放内存上简单。因此,开发大多数使用sbrk分配内存,使用brk释放内存。
八、系统底层的内存映射(mmap/munmap)
1 | #include <sys/mman.h> |
2 | void *mmap( void *start, size_t length, int prot, int flags, int fd, off_t offset); |
3 | int munmap( void *start, size_t length); |
参数公共部分:
start:指向欲映射的内存起始地址,通常设为 NULL,代表让系统自动选定地址,映射成功后返回该地址。
length:代表将文件中多大的部分映射到内存。 映射空间大小。建议4k倍数,不是4K倍数,自动对齐。
mmap独有部分:
prot:映射区域的保护方式。可以为以下几种方式的组合:
1.PROT_EXEC 映射区域可被执行
2.PROT_READ 映射区域可被读取
3.PROT_WRITE 映射区域可被写入
4.PROT_NONE 映射区域不能存取
flags:影响映射区域的各种特性。在调用mmap()时必须要指定MAP_SHARED 或MAP_PRIVATE。
1.MAP_FIXED 如果参数start所指的地址无法成功建立映射时,则放弃映射,不对地址做修正。通常不鼓励用此标志。
2.MAP_SHARED对映射区域的写入数据会复制回文件内,而且允许其他映射该文件的进程共享。
3.MAP_PRIVATE 对映射区域的写入操作会产生一个映射文件的复制,即私人的“写入时复制”(copy on write)对此区域作的任何修改都不会写回原来的文件内容。
4.MAP_ANONYMOUS建立匿名映射。此时会忽略参数fd,不涉及文件,而且映射区域无法和其他进程共享。
5.MAP_DENYWRITE只允许对映射区域的写入操作,其他对文件直接写入的操作将会被拒绝。
6.MAP_LOCKED 将映射区域锁定住,这表示该区域不会被置换(swap)。
fd:要映射到内存中的文件描述符。如果使用匿名内存映射时,即flags中设置了MAP_ANONYMOUS,fd设为-1。有些系统不支持匿名内存映射,则可以使用fopen打开/dev/zero文件,然后对该文件进行映射,可以同样达到匿名内存映射的效果。
offset:文件映射的偏移量,通常设置为0,代表从文件最前方开始对应,offset必须是分页大小的整数倍。
返回值:
若映射成功则返回映射区的内存起始地址,否则返回MAP_FAILED(-1),错误原因存于errno 中。
九、errno错误代码
1.EBADF 参数fd 不是有效的文件描述词
2.EACCES 存取权限有误。如果是MAP_PRIVATE 情况下文件必须可读,使用MAP_SHARED则要有PROT_WRITE以及该文件要能写入。
3.EINVAL 参数start、length 或offset有一个不合法。
4.EAGAIN 文件被锁住,或是有太多内存被锁住。
5.ENOMEM 内存不足。