本文转自博文如何实现一个malloc。就如做者本人所说,该博文大量参考了A malloc Tutorial,因此对照着阅读这两篇文章更能加深理解。html
任何一个用过或学过C的人对malloc都不会陌生。你们都知道malloc能够分配一段连续的内存空间,而且在再也不使用时能够经过free释放掉。可是,许多程序员对malloc背后的事情并不熟悉,许多人甚至把malloc当作操做系统所提供的系统调用或C的关键字。实际上,malloc只是C的标准库中提供的一个普通函数,并且实现malloc的基本思想并不复杂,任何一个对C和操做系统有些许了解的程序员均可以很容易理解。linux
这篇文章经过实现一个简单的malloc来描述malloc背后的机制。固然与现有C的标准库实现(例如glibc)相比,咱们实现的malloc并非特别高效,可是这个实现比目前真实的malloc实现要简单不少,所以易于理解。重要的是,这个实现和真实实如今基本原理上是一致的。git
这篇文章将首先介绍一些所需的基本知识,如操做系统对进程的内存管理以及相关的系统调用,而后逐步实现一个简单的malloc。为了简单起见,这篇文章将只考虑x86_64体系结构,操做系统为Linux。程序员
在实现malloc以前,先要相对正式地对malloc作一个定义。算法
根据标准C库函数的定义,malloc具备以下原型:编程
1 void* malloc(size_t size);
这个函数要实现的功能是在系统中分配一段连续的可用的内存,具体有以下要求:缓存
对于malloc更多的说明能够在命令行中键入如下命令查看:数据结构
1 man malloc
在实现malloc以前,须要先解释一些Linux系统内存相关的知识。app
2.1.1 虚拟内存地址与物理内存地址ide
为了简单,现代操做系统在处理内存地址时,广泛采用虚拟内存地址技术。即在汇编程序(或机器语言)层面,当涉及内存地址时,都是使用虚拟内存地址。采用这种技术时,每一个进程仿佛本身独享一片2N字节的内存,其中N是机器位数。例如在64位CPU和64位操做系统下,每一个进程的虚拟地址空间为264Byte。
这种虚拟地址空间的做用主要是简化程序的编写及方便操做系统对进程间内存的隔离管理,真实中的进程不太可能(也用不到)如此大的内存空间,实际能用到的内存取决于物理内存大小。
因为在机器语言层面都是采用虚拟地址,当实际的机器码程序涉及到内存操做时,须要根据当前进程运行的实际上下文将虚拟地址转换为物理内存地址,才能实现对真实内存数据的操做。这个转换通常由一个叫MMU(Memory Management Unit)的硬件完成。
2.1.2 页与地址构成
在现代操做系统中,不管是虚拟内存仍是物理内存,都不是以字节为单位进行管理的,而是以页(Page)为单位。一个内存页是一段固定大小的连续内存地址的总称,具体到Linux中,典型的内存页大小为4096Byte(4K)。
因此内存地址能够分为页号和页内偏移量。下面以64位机器,4G物理内存,4K页大小为例,虚拟内存地址和物理内存地址的组成以下:
上面是虚拟内存地址,下面是物理内存地址。因为页大小都是4K,因此页内便宜都是用低12位表示,而剩下的高地址表示页号。
MMU映射单位并非字节,而是页,这个映射经过查一个常驻内存的数据结构页表来实现。如今计算机具体的内存地址映射比较复杂,为了加快速度会引入一系列缓存和优化,例如TLB等机制。下面给出一个通过简化的内存地址翻译示意图,虽然通过了简化,可是基本原理与现代计算机真实的状况的一致的。
2.1.3 内存页与磁盘页
咱们知道通常将内存看作磁盘的的缓存,有时MMU在工做时,会发现页表代表某个内存页不在物理内存中,此时会触发一个缺页异常(Page Fault),此时系统会到磁盘中相应的地方将磁盘页载入到内存中,而后从新执行因为缺页而失败的机器指令。关于这部分,由于能够看作对malloc实现是透明的,因此再也不详细讲述,有兴趣的能够参考《深刻理解计算机系统》相关章节。
最后附上一张在维基百科找到的更加符合真实地址翻译的流程供你们参考,这张图加入了TLB和缺页异常的流程(图片来源页)。
2.2.1 内存排布
明白了虚拟内存和物理内存的关系及相关的映射机制,下面看一下具体在一个进程内是如何排布内存的。
以Linux 64位系统为例。理论上,64bit内存地址可用空间为0x0000000000000000 ~ 0xFFFFFFFFFFFFFFFF,这是个至关庞大的空间,Linux实际上只用了其中一小部分(256T)。
根据Linux内核相关文档描述,Linux64位操做系统仅使用低47位,高17位作扩展(只能是全0或全1)。因此,实际用到的地址为空间为0x0000000000000000 ~ 0x00007FFFFFFFFFFF和0xFFFF800000000000 ~ 0xFFFFFFFFFFFFFFFF,其中前面为用户空间(User Space),后者为内核空间(Kernel Space)。图示以下:
对用户来讲,主要关注的空间是User Space。将User Space放大后,能够看到里面主要分为以下几段:
下面咱们主要关注Heap区域的操做。对整个Linux内存排布有兴趣的同窗能够参考其它资料。
2.2.2 Heap内存模型
通常来讲,malloc所申请的内存主要从Heap区域分配(本文不考虑经过mmap申请大块内存的状况)。
由上文知道,进程所面对的虚拟内存地址空间,只有按页映射到物理内存地址,才能真正使用。受物理存储容量限制,整个堆虚拟内存空间不可能所有映射到实际的物理内存。Linux对堆的管理示意以下:
Linux维护一个break指针,这个指针指向堆空间的某个地址。从堆起始地址到break之间的地址空间为映射好的,能够供进程访问;而从break往上,是未映射的地址空间,若是访问这段空间则程序会报错。
2.2.3 brk与sbrk
由上文知道,要增长一个进程实际的可用堆大小,就须要将break指针向高地址移动。Linux经过brk和sbrk系统调用操做break指针。两个系统调用的原型以下:
1 int brk(void *addr); 2 void *sbrk(intptr_t increment);
brk将break指针直接设置为某个地址,而sbrk将break从当前位置移动increment所指定的增量。brk在执行成功时返回0,不然返回-1并设置errno为ENOMEM;sbrk成功时返回break移动以前所指向的地址,不然返回(void *)-1。
一个小技巧是,若是将increment设置为0,则能够得到当前break的地址。
另外须要注意的是,因为Linux是按页进行内存映射的,因此若是break被设置为没有按页大小对齐,则系统实际上会在最后映射一个完整的页,从而实际已映射的内存空间比break指向的地方要大一些。可是使用break以后的地址是很危险的(尽管也许break以后确实有一小块可用内存地址)。
2.2.4 资源限制与rlimit
系统对每个进程所分配的资源不是无限的,包括可映射的内存空间,所以每一个进程有一个rlimit表示当前进程可用的资源上限。这个限制能够经过getrlimit系统调用获得,下面代码获取当前进程虚拟内存空间的rlimit:
1 int main() { 2 struct rlimit *limit = (struct rlimit *)malloc(sizeof(struct rlimit)); 3 getrlimit(RLIMIT_AS, limit); 4 printf("soft limit: %ld, hard limit: %ld\n", limit->rlim_cur, limit->rlim_max); 5 }
其中rlimit是一个结构体:
1 int main() { 2 struct rlimit *limit = (struct rlimit *)malloc(sizeof(struct rlimit)); 3 getrlimit(RLIMIT_AS, limit); 4 printf("soft limit: %ld, hard limit: %ld\n", limit->rlim_cur, limit->rlim_max); 5 }
每种资源有软限制和硬限制,而且能够经过setrlimit对rlimit进行有条件设置。其中硬限制做为软限制的上限,非特权进程只能设置软限制,且不能超过硬限制。
在正式开始讨论malloc的实现前,咱们能够利用上述知识实现一个简单但几乎无法用于真实的玩具malloc,权当对上面知识的复习:
1 /* 一个玩具malloc */ 2 #include <sys/types.h> 3 #include <unistd.h> 4 void *malloc(size_t size) 5 { 6 void *p; 7 p = sbrk(0); 8 if (sbrk(size) == (void *)-1) 9 return NULL; 10 return p; 11 }
这个malloc每次都在当前break的基础上增长size所指定的字节数,并将以前break的地址返回。这个malloc因为对所分配的内存缺少记录,不便于内存释放,因此没法用于真实场景。
下面严肃点讨论malloc的实现方案。
3.2.1 数据结构
首先咱们要肯定所采用的数据结构。一个简单可行方案是将堆内存空间以块(Block)的形式组织起来,每一个块由meta区和数据区组成,meta区记录数据块的元信息(数据区大小、空闲标志位、指针等等),数据区是真实分配的内存区域,而且数据区的第一个字节地址即为malloc返回的地址。
能够用以下结构体定义一个block:
1 typedef struct s_block *t_block; 2 struct s_block { 3 size_t size; /* 数据区大小 */ 4 t_block next; /* 指向下个块的指针 */ 5 int free; /* 是不是空闲块 */ 6 int padding; /* 填充4字节,保证meta块长度为8的倍数 */ 7 char data[1] /* 这是一个虚拟字段,表示数据块的第一个字节,长度不该计入meta */ 8 };
因为咱们只考虑64位机器,为了方便,咱们在结构体最后填充一个int,使得结构体自己的长度为8的倍数,以便内存对齐。示意图以下:
3.2.2 寻找合适的block
如今考虑如何在block链中查找合适的block。通常来讲有两种查找算法:
两种方法各有千秋,best fit具备较高的内存使用率(payload较高),而first fit具备更好的运行效率。这里咱们采用first fit算法。
1 /* First fit */ 2 t_block find_block(t_block *last, size_t size) { 3 t_block b = first_block; 4 while(b && !(b->free && b->size >= size)) { 5 *last = b; 6 b = b->next; 7 } 8 return b; 9 }
find_block从frist_block开始,查找第一个符合要求的block并返回block起始地址,若是找不到这返回NULL。这里在遍历时会更新一个叫last的指针,这个指针始终指向当前遍历的block。这是为了若是找不到合适的block而开辟新block使用的,具体会在接下来的一节用到。
3.2.3 开辟新的block
若是现有block都不能知足size的要求,则须要在链表最后开辟一个新的block。这里关键是如何只使用sbrk建立一个struct:
1 #define BLOCK_SIZE 24 /* 因为存在虚拟的data字段,sizeof不能正确计算meta长度,这里手工设置 */ 2 3 t_block extend_heap(t_block last, size_t s) { 4 t_block b; 5 b = sbrk(0); 6 if(sbrk(BLOCK_SIZE + s) == (void *)-1) 7 return NULL; 8 b->size = s; 9 b->next = NULL; 10 if(last) 11 last->next = b; 12 b->free = 0; 13 return b; 14 }
3.2.4 分裂block
First fit有一个比较致命的缺点,就是可能会让很小的size占据很大的一块block,此时,为了提升payload,应该在剩余数据区足够大的状况下,将其分裂为一个新的block,示意以下:
实现代码:
1 void split_block(t_block b, size_t s) { 2 t_block new; 3 new = b->data + s; 4 new->size = b->size - s - BLOCK_SIZE ; 5 new->next = b->next; 6 new->free = 1; 7 b->size = s; 8 b->next = new; 9 }
3.2.5 malloc的实现
有了上面的代码,咱们能够利用它们整合成一个简单但初步可用的malloc。注意首先咱们要定义个block链表的头first_block,初始化为NULL;另外,咱们须要剩余空间至少有BLOCK_SIZE + 8才执行分裂操做。
因为咱们但愿malloc分配的数据区是按8字节对齐,因此在size不为8的倍数时,咱们须要将size调整为大于size的最小的8的倍数:
1 size_t align8(size_t s) { 2 if(s & 0x7 == 0) 3 return s; 4 return ((s >> 3) + 1) << 3; 5 }
1 #define BLOCK_SIZE 24 2 void *first_block=NULL; 3 4 /* other functions... */ 5 6 void *malloc(size_t size) { 7 t_block b, last; 8 size_t s; 9 /* 对齐地址 */ 10 s = align8(size); 11 if(first_block) { 12 /* 查找合适的block */ 13 last = first_block; 14 b = find_block(&last, s); 15 if(b) { 16 /* 若是能够,则分裂 */ 17 if ((b->size - s) >= ( BLOCK_SIZE + 8)) 18 split_block(b, s); 19 b->free = 0; 20 } else { 21 /* 没有合适的block,开辟一个新的 */ 22 b = extend_heap(last, s); 23 if(!b) 24 return NULL; 25 } 26 } else { 27 b = extend_heap(NULL, s); 28 if(!b) 29 return NULL; 30 first_block = b; 31 } 32 return b->data; 33 }
3.2.6 calloc的实现
有了malloc,实现calloc只要两步:
因为咱们的数据区是按8字节对齐的,因此为了提升效率,咱们能够每8字节一组置0,而不是一个一个字节设置。咱们能够经过新建一个size_t指针,将内存区域强制看作size_t类型来实现。
1 void *calloc(size_t number, size_t size) { 2 size_t *new; 3 size_t s8, i; 4 new = malloc(number * size); 5 if(new) { 6 s8 = align8(number * size) >> 3; 7 for(i = 0; i < s8; i++) 8 new[i] = 0; 9 } 10 return new; 11 }
3.2.7 free的实现
free的实现并不像看上去那么简单,这里咱们要解决两个关键问题:
首先咱们要保证传入free的地址是有效的,这个有效包括两方面:
第一个问题比较好解决,只要进行地址比较就能够了,关键是第二个问题。这里有两种解决方案:一是在结构体内埋一个magic number字段,free以前经过相对偏移检查特定位置的值是否为咱们设置的magic number,另外一种方法是在结构体内增长一个magic pointer,这个指针指向数据区的第一个字节(也就是在合法时free时传入的地址),咱们在free前检查magic pointer是否指向参数所指地址。这里咱们采用第二种方案:
首先咱们在结构体中增长magic pointer(同时要修改BLOCK_SIZE):
1 typedef struct s_block *t_block; 2 struct s_block { 3 size_t size; /* 数据区大小 */ 4 t_block next; /* 指向下个块的指针 */ 5 int free; /* 是不是空闲块 */ 6 int padding; /* 填充4字节,保证meta块长度为8的倍数 */ 7 void *ptr; /* Magic pointer,指向data */ 8 char data[1] /* 这是一个虚拟字段,表示数据块的第一个字节,长度不该计入meta */ 9 };
而后咱们定义检查地址合法性的函数:
1 t_block get_block(void *p) { 2 char *tmp; 3 tmp = p; 4 return (p = tmp -= BLOCK_SIZE); 5 } 6 7 int valid_addr(void *p) { 8 if(first_block) { 9 if(p > first_block && p < sbrk(0)) { 10 return p == (get_block(p))->ptr; 11 } 12 } 13 return 0; 14 }
当屡次malloc和free后,整个内存池可能会产生不少碎片block,这些block很小,常常没法使用,甚至出现许多碎片连在一块儿,虽然整体能知足某此malloc要求,可是因为分割成了多个小block而没法fit,这就是碎片问题。
一个简单的解决方式时当free某个block时,若是发现它相邻的block也是free的,则将block和相邻block合并。为了知足这个实现,须要将s_block改成双向链表。修改后的block结构以下:
1 typedef struct s_block *t_block; 2 struct s_block { 3 size_t size; /* 数据区大小 */ 4 t_block prev; /* 指向上个块的指针 */ 5 t_block next; /* 指向下个块的指针 */ 6 int free; /* 是不是空闲块 */ 7 int padding; /* 填充4字节,保证meta块长度为8的倍数 */ 8 void *ptr; /* Magic pointer,指向data */ 9 char data[1] /* 这是一个虚拟字段,表示数据块的第一个字节,长度不该计入meta */ 10 };
合并方法以下:
1 t_block fusion(t_block b) { 2 if (b->next && b->next->free) { 3 b->size += BLOCK_SIZE + b->next->size; 4 b->next = b->next->next; 5 if(b->next) 6 b->next->prev = b; 7 } 8 return b; 9 }
有了上述方法,free的实现思路就比较清晰了:首先检查参数地址的合法性,若是不合法则不作任何事;不然,将此block的free标为1,而且在能够的状况下与后面的block进行合并。若是当前是最后一个block,则回退break指针释放进程内存,若是当前block是最后一个block,则回退break指针并设置first_block为NULL。实现以下:
1 void free(void *p) { 2 t_block b; 3 if(valid_addr(p)) { 4 b = get_block(p); 5 b->free = 1; 6 if(b->prev && b->prev->free) 7 b = fusion(b->prev); 8 if(b->next) 9 fusion(b); 10 else { 11 if(b->prev) 12 b->prev->prev = NULL; 13 else 14 first_block = NULL; 15 brk(b); 16 } 17 } 18 }
3.2.8 realloc的实现
为了实现realloc,咱们首先要实现一个内存复制方法。如同calloc同样,为了效率,咱们以8字节为单位进行复制:
1 void copy_block(t_block src, t_block dst) { 2 size_t *sdata, *ddata; 3 size_t i; 4 sdata = src->ptr; 5 ddata = dst->ptr; 6 for(i = 0; (i * 8) < src->size && (i * 8) < dst->size; i++) 7 ddata[i] = sdata[i]; 8 }
而后咱们开始实现realloc。一个简单(可是低效)的方法是malloc一段内存,而后将数据复制过去。可是咱们能够作的更高效,具体能够考虑如下几个方面:
下面是realloc的实现:
1 void *realloc(void *p, size_t size) { 2 size_t s; 3 t_block b, new; 4 void *newp; 5 if (!p) 6 /* 根据标准库文档,当p传入NULL时,至关于调用malloc */ 7 return malloc(size); 8 if(valid_addr(p)) { 9 s = align8(size); 10 b = get_block(p); 11 if(b->size >= s) { 12 if(b->size - s >= (BLOCK_SIZE + 8)) 13 split_block(b,s); 14 } else { 15 /* 看是否可进行合并 */ 16 if(b->next && b->next->free 17 && (b->size + BLOCK_SIZE + b->next->size) >= s) { 18 fusion(b); 19 if(b->size - s >= (BLOCK_SIZE + 8)) 20 split_block(b, s); 21 } else { 22 /* 新malloc */ 23 newp = malloc (s); 24 if (!newp) 25 return NULL; 26 new = get_block(newp); 27 copy_block(b, new); 28 free(p); 29 return(newp); 30 } 31 } 32 return (p); 33 } 34 return NULL; 35 }
以上是一个较为简陋,可是初步可用的malloc实现。还有不少遗留的可能优化点,例如:
还有不少可能的优化,这里不一一赘述。下面附上一些参考文献,有兴趣的同窗能够更深刻研究。