漫谈 C++ 的内存堆实现原理

时间 2019-11-10

标签漫谈 c++ 内存实现原理栏目 C&C++ 繁體版

原文原文链接

若是我来设计 C++ 的内存堆，我会这样设计： html

进程首先会跟操做系统要一块大内存区域，我称之为 Division ，简称 div 。算法

而后，将这块 div 做为堆，就能够开始从堆里分配内存了。数据库

堆里未分配可以使用的内存区域称之为 Free Space ，一开始的时候， div 里只有一个 Free Space ，就是整个 div 。编程

若是只分配不回收的话， div 里永远都只有一个 Free Space 。随着分配和回收， div 里会产生多个 Free Space 。安全

咱们须要创建一张堆表来记录 Free Space ，这样才能知道每一次分配应该到哪一个 Free Space 里分配。网络

堆表应该是一个链表，便于插入和删除表项。表项就是 Free Space ，或者说表项描述 Free Space 。因此表项会包含 2 个字段，一个是 Free Space 的起始地址，另外一个是 Free Space 的结束地址。数据结构

同时还应该有一个指针，指向当前在用的表项，一次分配就是在当前表项指向的 Free Space 里分配，若是当前 Free Space 的大小不足以分配本次申请的内存块大小，则将指针指向当前 Free Space 的下一个 Free Space 。若是下一个 Free Space 的大小也不够，那么就继续指向下一个 Free Space 。如此循环。并发

那若是最后一个 Free Space 的大小也不够的话，就须要向操做系统要一个新的 div 。注意， Free Space 只能属于一个 div ，不能跨 div 。app

若是堆里的 Free Space 比较多，那么若是 Free Space 大小不够，有可能会连续找多个 Free Space 才找到足够大小的 Free Space ，这里就产生了一个性能问题。高并发

最坏的状况， “从头找到尾” ，到最后一个 Free Space 才足够大小。但，这还不是最坏的 ^^ ，若是最后一个 Free Space 的大小也不够的话，就要跟操做系统要一个新的 div ，这好像要 “更坏” 一点。 ^^

还有一个重要的问题须要考虑，就是若是跟操做系统要了 1 个以上的 div ，若是长期占用，这是一个不小的空间。那么，要怎样在 div 中的内存所有都已经回收（整个 div 是一个 Free Space）的时候，将 div 归还操做系统呢？

能够经过一个计数器。能够为每一个 div 设置一个计数器，同时在堆表项里增长一个字段： Free Space 所在的 div 。

这样，每次分配的时候就在计数器里加 1 ，每次回收就让计数器减 1 ，若是减 1 之后计数器的值是 0 ，那么就说明 div 已经所有回收，能够将 div 归还操做系统。

最后，我很好奇， C++ 是怎么解决内存碎片的问题的。哈哈哈哈

忽然发现堆的管理算法有点小复杂，若是堆表自己占用的内存空间是固定的，那么若是 Free Space 的数量超出了对表的空间所能存储的数量，这就有问题，若是舍弃一些比较小的 Free Space ，会形成内存泄露。

若是堆表的存储空间也是经过堆的方式来分配，那么，当应用程序申请了一块内存，此时产生了一个新的 Free Space ，为了记录这个 Free Space ，须要为描述这个 Free Space 的堆表项也申请一块内存，这样 Free Space 又会发生变化，可能产生 1 个新的 Free Space，或者要记录的这个 Free Space 发生变化，须要把这些状况也考虑进去。

还有一种状况是归还内存块的时候，这个内存块恰好在 2 个 Free Space 中间，那么归还这个内存块就不是简单的在堆表里添加一个堆表项，而是要和先后 2 个 FreeSpace “合并” 起来。这 3 个 Free Space 会合并成 1 个 Free Space ，在堆表里会删除原来的 2 个 Free Space 表项，同时在这 2 个表项的位置添加入合并后的新表项。

问题是，要怎么知道归还的内存块在某 2 个 Free Space 中间？好像只能遍历。但这意味着每次归还的时候都要遍历。

而后。

实际上，不只仅内存块在 2 个 Free Space 之间会存在这个问题，只要归还的内存块的任一边（前或后）和 1 个 Free Space 相连，都须要 “合并” 。

若是要快速的找到和本身邻近的 Free Space ，可能须要创建索引。能够创建不止一个的索引。

好比能够按起始位置创建索引，同时还能够按 Free Space 的大小创建索引。前者能够快速的寻找和当前归还的内存块相邻的 Free Space 。后者能够快速的寻找接近指定大小的 Free Space ，这能够用在分配的时候，寻找接近申请内存块大小的 Free Space 进行分配有利于提升内存利用率，减小碎片。

索引也能够排序，若是要优先从小的 Free Space 或者大的 Free Space 来分配的话，索引的排序做用也能够派上用场。

关于索引，我在《我发起了一个 .Net 开源数据库项目 SqlNet》 http://www.javashuo.com/article/p-gpuysmcv-q.html 中有一些论述。实际上，我正是考虑数据库中 Data Block 的 Free Space 如何管理，因此才继续思考内存堆的管理问题，而后就产生了上面的一些思考结果。

能够设想一下具体的作法：

若是不考虑堆的无限增加的话，设计起来并不太难：）所谓无限增加，主要是指堆表的无限增加。堆表为何会无限增加呢？堆表是保存 Free Space 的，若是 Free Space 无限增加，那么堆表就会无限增加。 Free Space 的数量是不肯定的，但理论上，彷佛不能给出一个限制。若是咱们给定堆表的长度是 1万，那么就只能记录 1万个 Free Space ，超出 1万个的 Free Space 会由于不能记录而处于 “遗弃” 的状态，既不能分配也不能回收。这就形成了内存泄漏。

若是在堆表达到上限的时候抛出异常 “堆表超出最大范围” ，就像 StackOverflow 或者 OutOfMemory ，但这可能会限制了应用程序的能力。

若是按照上文的说法，堆表的存储自己也彻底经过堆分配进行，这样能够很灵活，看起来只要内存空间足够，那么，堆表能够无限增加。

但这种作法是 “本身描述本身” 的一个循环，会致使算法复杂，循环，或者无解。因此咱们放弃了这种方式。

问题出在哪里呢？堆表项自身对于内存空间的占用不能计算到堆的分配里。堆表应该是单独占用一块空间，堆表项及索引项的添加删除在这个空间也会形成空闲空间（Free Space），但这些 Free Space 不能计算到堆里，而应该是独立于堆的存在。不然就会陷入上述的 “本身描述本身” 的循环。总之状况很复杂，可能无解。固然也许有解，但我不想继续思考下去了：）

因此，回到开始，若是不考虑堆的无限增加的话，就是说给定一个堆表的固定大小，咱们这样来设计堆试试看。通过上面的论述，实际上，若是要设计无限增加的堆表，那么，在固定大小的堆表基础上，增长一点：当当前堆表空间不够时，再申请一块堆表空间用于继续存放堆表，这样堆表就能继续增加了。

咱们提供一块连续的内存空间来存储堆表，这块内存空间咱们称之为堆表空间。按照上面说的，咱们先尝试实现一个固定大小的堆表空间的堆。

堆表的内容包括 Free Space 项和索引。索引由索引项组成，索引项最终会指向堆表项， Free Space 项之间经过链表的方式相连。 Free Space 项和索引项都存储在堆表空间里。

堆表还包括一个指针，指向堆表的最后一个元素的结束地址的下一个地址，咱们将这个指针称为 “Append 指针” 。

全部新建的堆表项（Free Space 项和索引项）都添加至 Append 指针指示的地址，每添加完一个堆表项， Append 指针会指向这个堆表项的结束地址的下一个地址。当 Append 指针指向的地址到堆表的结束地址之间的空间不够存放新的堆表项时，会检查 “堆表空闲空间计数器” ， —— 等 —— 什么是 “堆表空闲空间计数器” ？在堆表的使用过程当中，随着 Free Space 项和索引项的添加删除，固然也会出现 “空闲空间” ，咱们会用一个整数变量，来记录空闲空间有多少（以 Byte 为单位），每次删除堆表项（Free Space 项和索引项）的时候，会将回收的空闲空间累计到这个整数变量里。这个变量就是 “堆表空闲空间计数器” 。注意， “堆表空闲空间计数器” 记录的是 Append 指针指向的地址以前 “已使用的空间” 中因堆表项的删除而 “空出来” 的空闲空间。这些空闲空间平时不会去动它，只有上面说的 “当 Append 指针指向的地址到堆表的结束地址之间的空间不够存放新的堆表项时” ，才会去关心它。怎么关心呢？这个时候，会作一次 “垃圾回收” ，就是把这些空闲空间后面的数据向前移动，填补这些空闲空间，就能够了。固然，会先检查 “堆表空闲空间计数器” ，若是计数器值为 0 ，代表没有空闲空间，不须要垃圾回收，大于 0 表示有空闲空间，须要垃圾回收。若是没有要回收的空闲空间，或者回收了空闲空间之后 Append 指针指向的地址到堆表的结束地址之间的空间仍然不够存放新的堆表项，怎么办呢？对于固定大小的堆表，则抛出异常 “堆表超出最大范围” ，就像 StackOverflow 或者 OutOfMemory 。对于能够无限增加的堆表，则新申请一块堆表空间，继续工做。新的堆表空间和原来的堆表空间之间经过链表的方式相连。

一个堆表空间包括 3 个部分组成：

1 一块连续的内存空间

2 Append 指针

3 堆表空闲空间计数器

要申请新的堆表空间，须要提早进行，不要等到空间不够用的时候再进行。这是由于新的堆表空间的申请一样也是经过堆的方式进行，一样须要在堆表里记录堆表项（Free Space 项和索引项）。当某一次申请或回收须要记录堆表项（Free Space 项和索引项）而空间不够时再去申请新的堆表空间，则本次应用程序的申请或者回收所产生的堆表项（Free Space 项和索引项）和申请新的堆表空间所产生的堆表项（Free Space 项和索引项）要放在一块儿计算和存储，这样状况很复杂。

因此，应用程序的申请和回收内存块，和申请新的堆表空间，应该是 2 次独立操做。因此须要提早进行 “未雨绸缪” 。提早到什么程度呢？在原来的堆表空间的剩余空间还足够存储一次申请内存块产生的可能的最大数量的堆表项（Free Space 项和索引项）的时候。

申请一次内存块可能产生多少堆表项（Free Space 项和索引项）？ Free Space 项容易理解，上文也分析过。那么会产生多少索引项？

上文中提到能够建立 2 个索引： 1 Free Space 起始地址做为检索条件的索引， 2 Free Space Size（空间大小）做为检索条件的索引。

索引 1 能够用作回收时查询和回收的内存块相邻的 Free Space ，若是 2 者是相接的，则会进行合并。

索引 2 能够用作分配时查找 Size（空间大小）最接近申请内存块大小的 Free Space 。

但实际上，索引的建立也是比较消耗时间的，分配能够采用前文最先提出的先在当前 Free Space 中分配，若当前 Free Space 的空间大小不足以分配，则查找下一个 Free Space 分配，以此递推。在内存空间充裕的条件下，这种方式比查找索引快，同时避免了建立索引消耗的时间。

咱们接下来就来分析索引的建立和查询：

根据上述，咱们只会创建和使用索引 1 ，用于回收时合并相接的 Free Space 。

索引 1 在分配时建立（更新），在回收时查询并更新。

索引 1 的索引项是这样：最高位字节用来保存索引项的值，只会用到低位的 2 位，表示 4 种状况： 00 , 01 , 10 , 11 。后面再跟 4 个字节或 8 个字节表示指向的子索引项或者 Free Space 项的地址。若是是 32 位或 “Any CPU” 应用程序，则是 4 个字节，若是是 64 位应用程序，则是 8 个字节。

在分配时，用于分配的 Free Space 的大小（Size）和起始地址会发生变化。对于索引 1 ，只需根据起始地址来更新索引便可。

Free Space 的起始地址字段表示空闲空间的起始地址。同上，若是是 32 位或 “Any CPU” 应用程序，则是 4 个字节，若是是 64 位应用程序，则是 8 个字节。根据《我发起了一个 .Net 开源数据库项目 SqlNet》 http://www.javashuo.com/article/p-gpuysmcv-q.html 文中对于索引的论述，对于 32 位的数据，会创建 32 / 2 = 16 个索引项 -_- ，对于 64 位的数据，会创建 64 / 2 = 32 个索引项 -_- 。

因此，对于 32 位或 “Any CPU” 应用程序，分配时 Free Space 起始地址发生变化须要修改索引最多须要约 16 个索引项，或者说时间花费是 O(16) 。由于检索 1 个索引项须要判断 4 种状况： 00 , 01 , 10 , 11 。因此咱们能够假设 1 次操做的时间是 4ns （4 纳秒），那么 O(16) 的时间就是 16 * 4 = 64 ns （64 纳秒）。而回收须要查找索引找到和回收的内存块相邻的 Free Space ，同时回收后可能更新相邻 Free Space 的起始地址（合并），或者产生一个新的 Free Space ，对于前者，须要修改索引，对于后者，须要建立索引，但无论是哪一种，最多须要检索（修改）的索引项约 16 个，能够认为时间花费是 O(16) ，而回收时查找索引寻找相邻 Free Space 的时间花费也能够认为是 O(16) ，因此加起来就是回收的时间花费是 O(16) + O(16) = O(32) ，同上，假设 1 次操纵的时间是 4ns ，则回收的时间花费是 32 * 4 = 128 ns （128 纳秒）。固然分配和回收具体花费的时间还会包括修改 Free Space 起始地址， Next 指针，合并时删除多余的 Free Space 项等，这些先忽略不计，在下面估算的时候会酌情估算进去。

一次分配的时间是 64ns ，再加上分配时可能发生的一些遍历（在当前 Free Space 的大小不够时，访问下一个 Free Space 尝试分配，以此递推），就按 80ns 算， 1 秒钟大概能够进行 1200万次分配。如何？还行吧，呵呵。不过比起我想象中的 new ，仍是慢了一点，我想象中的 new 应该是 1ns new 一个嘛！ P： new 就是分配。

一次回收的时间是 128ns ，就按 150ns 算， 1 秒钟大概能够进行 600万次回收。能不能再快一点？ ^^

对于 64 位应用程序，时间花费是 32 位的 2 倍，因此 1 秒钟能够分配 600万次，回收 300万次。如何？哎？为何 64 位反而慢了？

上面的分配和回收的执行速度是针对 1 个 CPU 核分析的，但对于多核，分配和回收的执行速度也是如此。由于堆是进程内全部线程共享的，堆表也是共享的，在进行分配和回收时要修改堆表，此时须要对堆表进行同步/互斥（Lock），因此，对于多核，分配和回收的执行速度也是如此。

从这里能够看出，堆的这一特性会成为瓶颈。在高频高密度计算的场合。好比高并发实时响应式系统。说的直接一点，就是跟如今的互联网大规模计算有关。

这一类型的瓶颈也表如今其它方面。好比套接字（Socket）， Socket 对于每一个网卡只会有一个线程负责从网卡读写数据。这是个人推测。一个端口（Port）的 Socket 由一组线程组成： 1 负责从网卡读写数据的线程（1 个网卡对应 1 个线程）， 2 处理和分发数据给应用程序的线程们（有若干个线程，线程数和 CPU 的核数对应，能够包括虚拟线程(超线程) 数）。在线程 1 和线程 2 们协做的时候，会有一个共享数据区，线程 1 会把从网卡读取到的数据放到共享数据区，线程 2 们会从共享数据区取出数据处理分发。显然，线程 1 和线程 2 们的协做须要同步/互斥（Lock），

咱们能够看一下这篇文章《面向对象编程的弊端是什么？》 https://www.zhihu.com/question/20275578/answer/136886316?utm_source=com.tencent.tim&utm_medium=social&utm_oi=697587017629851648

文中有一幅图：

如图红线所示， Mutex（同步 / 互斥 Lock）的时间是 17ns （17 纳秒）。这个时间是一个不太能忽视的时间。

因此，这会成为利用并行计算大幅提高计算能力的瓶颈。而利用并行计算大幅提高计算能力正是当下和将来的主题。

另外就是，一个网卡只有一个 IO 线程，这也可能成为瓶颈。当网络技术发展到 5G 或 6G 的时候，会不会有 NPU（Net Process Unit）出现？就像 GPU 同样。 ^^

实际上，对于堆表的无限增加，有一个 “终极” 的解决办法，或者说更好的办法。就是 GC （垃圾回收器）。

在现代，或者说 “当代” 的语言，如 C# , Java 里都有 GC 。 GC 能够将 Free Space 的数量控制在有限和不多的范围。这样就不存在堆表的无限增加了。

而后。

固然， GC 要登记全部变量，并按期遍历，移动数据，这些也要花费时间的。

堆表的无限增加，这是一个问题。堆表增加，表示 Free Space 增多，碎片也增多，这样在分配时可能会遍历比较多的 Free Space 。

对于 64 位应用程序， 64 位理论上的寻址空间能够达到 16eb ，若是应用程序对于存储空间的使用是没有限制的，那么，一段时间以后，堆表，或者说 Free Space （包括碎片）的数量可能会达到很大的数量。

假想一下，若是 Free Space 不少，碎片也不少，那么可能要遍历不少次才能找到大小足够的 Free Space 进行分配。这个时候，咱们能够考虑加入这样的算法，最多遍历 10 个 Free Space ，遍历了 10 个 Free Space 还找不到大小足够的 Free Space ，则向操做系统申请 1 个新的 div ，并将 div 做为新的 Free Space 插入到当前位置，并从这个 div（新的 Free Space）中分配。分配之后，下一次分配固然也会从这个 div 开始，若是这个 div 的剩余空间不够，则访问下一个 Free Space 。若是访问了 10 个 Free Space 也找不到足够大小的 Free Space ，则重复上述流程，向操做系统申请 1 个新的 div ，并将 div 做为新的 Free Space 插入到当前位置，并从这个 div（新的 Free Space）中分配。以此递推。

这种方式，可能会浪费一些空间，或者说，会向操做系统申请多一些的空间（div），可是在时间上提升了效率。这也算是 “空间换时间” 吧。在如今来说，硬件容易扩充，提高计算速度是一个主要目标。

根据以上，咱们再来整理一下具体的作法。

咱们以 64位应用程序的标准来实现：

当进程启动时，会分配一块固定大小的连续空间，做为堆的基础元数据区，基础元数据区包括 5 部分：

1 Append 指针，指向堆表可插入堆表项的地址（当前最后一个堆表项以后），插入堆表项后， Append 指针会指向堆表项结束地址的下一个地址。 Append 指针的初始值应指向第 5 个堆表项的起始位置。由于会在堆表中预先创建 4 个 1 级索引项，见下面第 4 部分。

2 堆表的 Free Space 项链表头指针，指向 Free Space 项链表的头。（Free Space 项之间经过链表的方式链接起来）

3 当前 Free Space 项指针，指向上一次用于分配的 Free Space 项。下一次分配会先尝试在上一次分配的 Free Space 中进行，若 Free Space 的大小不够，会访问下一个 Free Space 尝试分配。分配成功后，当前 Free Space 项指针会指向分配成功的 Free Space 项。固然这里面还有些具体的逻辑，好比访问超过 10 个 Free Space 项仍然找不到大小足够的 Free Space ，则会向操做系统申请新的 div ，做为 Free Space 加入进来，而后在这个新的 div 中分配。

4 堆表的初始空间。堆表的初始空间能够是 1 MB 。进程启动时，会初始化基础元数据区，此时应在堆表的第 1 ~ 4 个堆表项位置预先创建 1 级索引项（00 , 01 , 01 , 11）。所谓初始空间是指这部分是固定不变的，以后堆表空间不够用时，会在堆中申请新的堆表空间。这些新申请的堆表空间空出来的时候会归还堆，但初始空间是不变的，不变是指一直存在，大小不变。且初始空间不属于堆。

5 Next 指针，指向下一个堆表空间。随着堆的规模的增加，堆表大小不够时，会从堆里申请新的堆表空间，新的堆表空间会和初始空间用链表的方式链接起来，能够申请多个堆表空间，如：初始空间 -> 第 1 个新申请空间 -> 第 2 个新申请空间 -> 第 3 个新申请空间 -> …… 第 n 个新申请空间 -> ……

当堆的规模缩小时，会释放空闲的堆表空间（归还堆）。

初始空间不属于堆，固然永远不会释放。

接下来，咱们这样来定义堆表项：

堆表项分为 2 种：

1 索引项

2 Free Space 项

具体规则是：

1) 索引项和 Free Space 项都占用 34 个字节。第 1 个字节是标识字节，为 1 表示索引项，为 2 表示 Free Space 项，为 0 表示已删除。

2) 对于索引项，第 2 个字节表示索引值，就是 00 , 01 , 10 , 11 这 4 种值中的一种，实际上这 4 种值只用到了 2 位，不过咱们仍是用一个字节来存储。若是是十进制表示这 4 个值，就是 0 , 1 , 2 , 3 。咱们设计的是 4 阶索引，第 3 ~ 10 个字节存储第 1 个子索引项或 Free Space 项的地址（64 位地址用 8 个字节存储），第 11 ~ 18 个字节存储第 2 个子索引项的地址，第 19 ~ 26 个字节存储第 3 个子索引项的地址，第 27 ~ 34 个字节存储第 4 个子索引项的地址。若 8 个字节表示的 64 位地址（ulong 无符号长整型 uInt64）为 0 ，表示子项不存在。有关索引和 4 阶索引，我在《我发起了一个 .Net 开源数据库项目 SqlNet》 http://www.javashuo.com/article/p-gpuysmcv-q.html 一文中有论述。

因此，能够看出，索引项长度是 1 + 1 + 8 + 8 + 8 + 8 = 34 个字节。

3) 对于 Free Space 项，第 2 ~ 9 个字节表示起始地址，第 10 ~ 17 个字节表示结束地址。第 18 ~ 25 个字节表示所在的 div 的起始地址。第 26 ~ 33 个字节表示 Next 指针指向下一项 Free Space 项（Free Space 项之间会经过 Next 指针来用链表的方式链接起来）。 Free Space 项的长度是 1 + 8 + 8 + 8 + 8 = 33 个字节。

为了便于管理， Free Space 项的长度也定义为 34 个字节，和索引项同样。多出来的 1 个字节不会用到。

将索引项和 Free Space 项都定义为 34 位是便于管理，或者说便于算法处理。堆表进行垃圾回收的时候，只须要每隔 34 个字节检查一次标识字节，就能够知道堆表项是否已删除，若已删除则将后面的堆表项移动上来，填补已删除的空闲空间。这就是堆表的垃圾回收。

div ，接下来讲明 div 的定义规则。 div 是进程向操做系统申请的一块大的内存区域，用于做为堆空间。

第 1 次分配内存块时会申请第 1 块 div 。若是历来没有申请过内存块，则不会申请 div 。

div 分为 3 个部分：

1 结束地址， div 的结束地址，用 8 个字节表示（ulong 无符号长整型 uInt64）

2 分配计数器 useCount ，用于记录分配的内存块数量，若计数器的值为 0 ，表示 div 彻底空闲，即没有分配任何空间，能够归还操做系统。固然刚申请到 div 的时候，计数器的值也是 0 ，不过那时会接着用于分配。计数器也用 8 个字节表示（ulong 无符号长整型 uInt64）

3 剩余的空间用于分配。

接下来讲明运行逻辑：

咱们先估算一下， 1 MB 的堆表空间够存放多少个 Free Space 项（包含索引项）？

Free Space 项的地址是 64 位地址，要为 64 位地址创建索引，须要 64 / 2 = 32 个索引项。每一个索引项占据的空间是 34 个字节，再加上 Free Space 项占据的 34 个字节， 1 个 Free Space 须要的存储空间是 (32 + 1) * 34 = 1122 个字节。实际中会比 1122 小，由于索引的父节点存在共用的现象。咱们能够按 1024 来算，存储一个 Free Space 须要 1024 个字节（包含索引项），那么 1 MB 能够存储 1024 个 Free Space（包含索引项）。

因此， 1 MB 的堆表能够记录 1024 个 Free Space ，若是应用程序申请和归还内存块产生的 Free Space 不超过 1024 个的话， 1 MB 的堆表就够了。若是超过，则须要申请新的堆表空间。新的堆表空间在堆中申请。能够仍然申请 1 MB 。若是新申请的 1 MB 堆表空间用完了，能够继续申请 1 MB ，以此递推。固然，实际中不会等到堆表空间不够用时才去申请新的堆表空间，上文分析过，若是这样的话，会陷入 “本身描述本身” 的循环中，因此，应该在快用完（至少还足够保存一次申请产生的最大的 Free Space 变化 ( 包含索引项 ) ）的堆表空间时就申请新的堆表空间。

当应用程序第 1 次申请内存块时，堆管理程序会检查基础元数据区的第 1 个 div 的起始地址，若为 0 （div 不存在），就向操纵系统申请 div ，申请到后将 div 的起始地址记录到基础元数据区的 “第 1 个 div 的起始地址” 。

而后，将 div 的第 3 部分（用于分配的空间）做为 1 个 Free Space 记录入堆表（这是第 1 个 Free Space）。固然，记录的操做包括了创建索引。注意， 1 级索引项（00 , 01 , 10 , 11）固定存储在堆表的第 1 ~ 4 个堆表项位置。应用程序启动，初始化基础元数据区时应预先建好这 4 个索引项。

接下来，就开始在堆表中访问 Free Space 进行分配，固然如今只有 1 个 Free Space ，就是上面刚添加进去的 Free Space 。分配的话，就从 Free Space 的起始地址开始分配。好比，要申请 1 KB 的内存块，那么就把 Free Space 起始地址 ~ Free Space 起始地址 + 1 K - 1 这块内存分配给应用程序。若是申请的内存块大小比这个第 1 个 Free Space 都大，那么应该抛出异常 “只容许申请大小在 xx 范围内的内存块” 。

分配的具体工做：修改当前 Free Space 的起始地址，修改成 Free Space 起始地址 + 1 K ，同时修改索引，根据 Free Space 原来的起始地址遍历索引项，遍历到和新的起始地址不一样的索引项就修改索引项。这么说好像不知道在说什么。好吧，咱们举个具体的例子：

咱们的设计是 64 位地址，举例的话就简单一点，咱们以 8 位地址为例，假设 Free Sapce 的起始地址是 0 （0000 0000），申请 4 个字节大小的内存块。

申请前 Free Space 的索引是这样的： 00 -> 00 -> 00 -> 00 ，申请后 Free Sapce 的起始地址会变成 4 （0000 0100），相应的，索引会变成： 00 -> 00 -> 01 -> 00 ，能够看到，从第 3 个索引项开始，新的索引和旧的索引变得不一样，因此咱们从第 3 个索引项开始修改为新的索引项就能够了。

整个修改索引的过程会遍历所有的索引项（包含了修改）， 64 位地址是 32 个索引项，因此分配的时间复杂度约大于 O(32) （还要考虑其它的操做，因此是约大于），咱们上文中就是这样估算的。

其它还有什么操做呢，好像没有了。 ^^

分配就 2 步操做： 1 修改 Free Space 起始地址， 2 修改索引。

接下来是归还，归还分为 4 种状况：

1 归还的内存块的先后不和已有的 Free Space 相接，这样归还会产生一个新的 Free Space 。

2 归还的内存块和前面或者后面已有的 Free Space 相接，这样须要和相接的 Free Space 合并。

3 归还的内存块和前面和后面已有的 Free Space 相接，这样须要和先后 2 个 Free Space 合并。

4 归还的内存块没有相邻的 Free Space ，这种状况比较特殊，这种状况就是整个 div 的内存彻底被分配出去的状况。

具体流程是这样：

应用程序将内存块的起始地址提供给堆来归还这块内存块。堆根据内存块的起始地址查找索引，查找和内存块前相邻的 Free Space 。前相邻，是指相邻且在前面。什么是前面？ Free Space 的起始地址小于内存块的起始地址叫前面，大于叫后面。

根据索引查找到前相邻的 Free Space ，还不必定是真正的前相邻的 Free Space ，还要加一个判断条件： Free Space 所在的 div 和内存块所在的 div 是同一个 div ，这样才是前相邻的 Free Space 。

咱们这样来定义前相邻后相邻：

前相邻：起始地址小于内存块的起始地址，且和内存块属于同一个 div ，则为前相邻。

后相邻：起始地址大于内存块的起始地址，且和内存块属于同一个 div ，则为前相邻。

若是查找不到前相邻，那么就根据基础元数据区里的 Free Space 链表头指针找到头指针指向的 Free Space 项，这个 Free Space 项就是内存块的后相邻。

若是 Free Space 链表头指针为空（0），也表示没有相邻（既没有前相邻，也没有后相邻）。

什么状况下 Free Space 链表头指针为空（0）呢？在应用程序初始化后，尚未分配的时候。以及分配之后，整个 div 都被分配出去。若是有多个 div ，全部 div 都被彻底的分配出去，头指针也为空（0）。

头指针不空，能够找到起始地址大于或小于内存块起始地址的 Free Space ，但 Free Space 和内存块不在同一个 div 的话，也不是相邻。

怎么判断 Free Space 和内存块在不在同一个 div ？ Free Space 项有一个字段是所在 div 的起始地址， div 的第 1 个部分是 div 的结束地址（见上文对 div 的定义），根据 div 的起始地址能够找到 div 的结束地址，根据 div 的起始地址和结束地址能够判断内存块在不在 div 里。

找到前相邻后，判断前相邻的结束地址 + 1 和内存块的起始地址是否相等，若相等，则二者应合并。但这里还要进一步的判断，是状况 2 仍是状况 3 ，因此还须要根据前相邻的 Next 指针找到下一个 Free Space 项，这就是后相邻。判断后相邻的起始地址和内存块的结束地址 + 1 是否相等，若相等，表示是状况 3 ，若不等，表示是状况 2 。

若是没有相邻的 Free Space ，就是状况 4 。若是有相邻的 Free Space ，但既不是状况 2 ，也不是状况 3 ，就是状况 1 。

对于状况 1 ，须要新建一个 Free Space 项，插入到 Free Space 项链表里，插入位置是内存块的前相邻以后，或者说，后相邻以前。固然，新建 Free Space 项须要创建相应的索引。索引有 32 个索引项，因此新建 Free Space 的时间复杂度约大于 O(32) 。再加上查找前相邻的时间复杂度 O(32) ，因此状况 1 的时间复杂度约大于 O(32) + O(32) = O(64) ，约大于 O(64) 。上文就是这样估算的。

对于状况 2 ，若是和前相邻相接，就修改前相邻的结束地址和索引就能够，若是和后相邻相接，修改后相邻的起始地址和索引就能够，这个和分配的操做方法同样，参考上文分配的部分就能够。

对于状况 3 ，能够修改前相邻的结束地址和索引，同时删除后相邻，相应的，后相邻的索引也要删除。删除索引的步骤是：根据后相邻的起始地址遍历索引项，对于只有 1 个子索引项的索引项删除便可。只有一个子索引项表示从当前索引项开始的索引路径仅仅指向要删除的这个后相邻。

对于状况 4 ，直接按照内存块的起始地址结束地址新建一个 Free Space 项，添加到 Free Space 堆表，固然会创建相应的索引。同时，还要将 Free Space 项插入 Free Space 项链表里。插入位置在 —— 根据索引查找出起始地址小于本身的 Free Space 项，插入到这一项以后就行。注：由于不在同一个 div ，因此不能叫前相邻或者后相邻。若是查找不到起始地址小于本身的，就插入到头，即基础元数据区里的 Free Space 链表头指针指向本身，本身的 Next 指针指向原来头指针指向的那一项。若是头指针原来是空（0），那就让头指针指向本身就能够了。

Free Space 项链表不是一个独立的东西，而是堆表里的 Free Space 项之间会经过 Next 指针来用链表的方式链接起来。由于只有 Next 指针，因此是单向链表。如今看起来，单向链表够用了。 -_- '

每次申请和归还后会检查是否进行垃圾回收，当知足如下 2 个条件时进行垃圾回收：

1 Append 指针到堆表结束地址的内存空间小于 1500 个字节时，

2 堆表的空闲空间超过堆表空间的 2/3 的时候

每次垃圾回收后会检查是否须要扩充堆表，当知足如下条件时扩充堆表：

Append 指针到堆表结束地址的内存空间小于 1500 个字节时，

扩充堆表就是申请新的堆表空间和初始空间用链表的方式链接起来，固然，随着堆的规模的扩大，能够申请第 2 个、第 3 个、第 n 个 …… 堆表空间，用链表的方式连起来就是：初始空间 -> 第 1 个新申请空间 -> 第 2 个新申请空间 -> 第 3 个新申请空间 -> …… 第 n 个新申请空间 -> ……

这一点的意义上面已经屡次分析过，为了不陷入 “本身描述本身” 的陷阱，因此须要在堆表空间快用完时，扩充堆表空间。堆表空间最少要可以存储一次分配（包含可能申请 div 的状况）所产生的 Free Space 项（包含索引项）。通常的分配只需修改 Free Space 项的起始地址和索引，当有申请 div 的情形时，会新建 Free Space 项及完整的索引（32 个索引项），这应该是分配时占用空间最大的状况，咱们按这种状况来计算。上面说过， 1 个 Free Space （包含索引项）会占用 1122 个字节，咱们放宽松一点，在堆表剩余空间只有 1500 个字节时就扩充堆表。

那何时 “压缩” 或者说释放空闲出来的堆表空间呢？

在垃圾整理后，检查最后一个 “不空” 的堆表空间，即最后一个存储了至少 1 个堆表项的堆表空间，若是这个堆表空间的空闲空间超过堆表空间的 2/3 ，那么将释放这个堆表空间以后全部的堆表空间。释放就是将堆表空间归还堆。上文说了，初始空间之外的堆表空间都是从堆里申请的。

初始空间不属于堆，显然，永远不会释放。

说到这里，显然， “堆表” 是一个可扩充的，由若干个线性表经过链表的方式链接起来的数据结构。

Append 指针指向的是最后一个堆表项，这个堆表项可能在初始空间，也可能在新申请的第 n 个堆表空间。

在分配时，会从当前 Free Space 项指针指向的 Free Space 项开始尝试分配，若是当前项大小不够，会访问下一个 Free Space 项，若是访问超过 10 个 Free Space 项还找不到大小足够的 Free Space ，则会向操做系统申请新的 div ，做为 Free Space 加入进来，而后在这个新的 div （新的 Free Space）中分配。

这主要是从执行速度的角度考虑。这也算是 “空间换时间” 。

这逻辑真的乱，烦。

咱们能够用文件的方式来模拟实现这个堆管理算法。

就是用一个文件模拟一块内存区域，来实现这个堆算法。

咱们会先实现一个 EnLargableList 的数据结构， EnLargableList 是一个线性表经过链表的方式链接起来的可扩充的数据结构，用来实现堆表。

堆的复杂来自于堆表的动态增加（无限增加），若是堆表是固定大小的，那么堆并不太难。

上面有一个地方的逻辑有漏洞，向操做系统申请了一个 div 以后，除了将 div 可分配的空间做为一个 Free Space 项加入 Free Space 项链表外，还应该新建一个 “空的” Free Space 项加入。这个 “空的” Free Space 项的起始地址和结束地址都是 div 的可分配空间的起始地址。由于起始地址和结束地址相等，因此是 “空的” 。由于大小是 0 ，老是小于申请的内存块的大小，因此，在分配的时候不会分配这个 Free Space 。

这个空的 Free Space 有什么用呢？这是为了解决整个 div 都被彻底的分配出去的状况，上文分析过了，整个 div 都被彻底的分配出去的话， Free Space 链表里就没有这个 div 的 Free Space ，这样当这个 div 里的内存块归还时，会找不到前相邻和后相邻，从而不知道这个内存块是哪一个 div 的，这样归还的逻辑就有问题，就算无论是哪一个 div 而直接将内存块做为 Free Space 归还，最终也会致使即便这个 div 已经所有空闲（全部分配出去的内存块都归还了），可是没法将这个 div 归还操做系统。至关于这个 div 处于 “半遗弃” 的状态。由于它的 Free Space 仍然能够继续分配和归还，但这个 div 已经不在正式名单上了，没法在所有空闲时归还操做系统。固然，实际中这样的操做是不容许的，由于 Free Space 项最后一个字段就是指向本身所在 div 的起始地址，就是说 Free Space 项应该知道本身所在的 div ，若是不知道，程序不能运行下去。

因此，每一个 div 必定会有一个空的 Free Space ，无论 div 的空间如何分配，这个空的 Free Space 会一直存在下去，直到 div 归还操做系统，这个空的 Free Space 才会被删除。

由于咱们没有专门的表来记录 div ，因此这个空的 Free Space 至关于 div 的表明，或者占位。

上面的作法仍是有一点问题。用一个 “空的” Free Space 来表示 div 会有一些问题。实际上 “空的” Free Space 不是空的，是大小为 1 个字节的空间。起始地址和结束地址相等， Free Space 的大小 = 结束地址 - 起始地址 + 1 = 1 。因此，在归还 Free Space 时，若是归还的 Free Space 和这个 “空的” Free Space 相接，会和 “空的” Free Space 合并，这又会引出合并后下次分配时第 1 个字节不能分配（做为 “空的” Free Space）之类的判断，会把算法逻辑变复杂。

因此，咱们放弃了这种方式。正统的作法应该仍是把 div 记录到堆表里，也会为 div 创建索引。也就是说，增长一种堆表项： div 项。标识字节（第 1 个字节）为 3 表示 div 项。 div 项的第 2 ~ 9 个字节存储 div 的起始地址。固然 div 项的长度也是 34 （和索引项 Free Space 项相同），多余的字节不会用到。

这样，在归还内存块时，若是找不到前相邻，也找不到后相邻，说明 div 被彻底分配出去了，此时就会根据索引查找 div ，找到起始地址小于内存块的起始地址且相邻的 div ，这就是内存块所在的 div 。

归还内存块后， div 的分配计数器会减 1 ，减 1 后检查计数器值是否为 0 ，若为 0 则 div 的空间已彻底空闲，因而将 div 归还操做系统。

但这样的作法仍是有问题，要为 div 创建索引，这有一点额外的麻烦，好比如今的堆表项开始的 4 个项位置存储的是 4 个 1 级索引项，若是要为 div 创建索引，须要专门再为 div 创建 4 个 1 级索引项，这些会增长算法内容，会变得复杂或者麻烦。

因此，咱们仍是回到用一个 “空的” Free Space 来表示 div ，或者占位的作法。在申请一个新的 div 的时候，会建立 2 个 Free Space ，一个是 “空的” Free Space ，另外一个是可用的 Free Space 。 div 的开头会用 8 + 8 = 16 个字节分别表示结束地址和分配计数器 use Count ， “空的” Free Space 就是第 17 个字节，起始地址和结束地址都是第 17 个字节，从第 18 个字节开始就是可用空间了，可用的 Free Space 就是第 18 个字节开始到 div 的结束地址。

咱们能够给 Free Space 项增长一个字节来表示 Free Space 的 “Type” ，在标识字节以后。第 1 个字节是标识字节，咱们用第 2 个字节来表示 Free Space Type ， 0 表示 “空的” Free Space ， 1 表示普通的 Free Space 。这样的话， Free Space 项和索引项同样，都是 34 个字节了。

在分配和回收时须要判断 Free Space 时 “空的” Free Space 仍是普通的 Free Space 。上文中定义过，标识字节为 2 表示普通的 Free Space 。

在分配时判断，若是是 “空的” Free Space ，就不进行分配，而是访问下一个 Free Space 尝试分配。

在回收时会寻找前相邻，若是前相邻是 “空的” Free Space ，则不进行判断是否相接若相接则合并的逻辑。

EnLargableList （用于堆表）会设定这样一些参数：

1 whenRecycleFragment ，这是一个整数，表示碎片数量超过多少应开始碎片回收，能够设置为 1万，碎片数量是以对表项为单位。假设堆表空间是 1MB ，每一个堆表项占用 34 个字节，能够存约 3 万个堆表项，约表示 1024 个 Free Space （每一个 Free Space 最多由 33 个堆表项表示，包含 32 个索引项 + 1 个 Free Space 项）。

若是设置 whenRecycleFragment 为 1 万，至关因而一个堆表空间中有 1/3 的空闲空间，此时回收。效果怎么样？不知道。

或者说至关于一个堆表空间中记录了 600 个 Free Space 项，还有 300 个 Free Space 的位置能够记录，此时回收。效果怎么样？不知道。

上文中提到当 Append 指针到堆表空间的结束位置的空间小于 1500 时回收，但如今放弃了这种作法。

由于这种作法好像不太科学，在应对规模很大的堆时候，好像不太适用。堆的规模很大，是指能够无限制的使用地址空间，内存块数量和 Free Space 数量（包含碎片）可能持续增加。大小 1MB 的堆表能够存约 3 万个堆表项，以堆表项为单位遍历一遍须要遍历 3 万个堆表项。 3 万是一个不小的数量，因此咱们想当碎片（空闲出来的项位置）达到 1 万的时候回收可能会比较好。

2 whenEnLarge ，这是一个整数，表示 append 指针到堆表末尾的空间还有多少时扩充堆表容量，扩充堆表容量就是申请新的堆表空间，新申请的堆表空间以链表的方式链接到当前堆表空间。

3 heapTableSpace ：就是每个堆表空间的大小，能够设为 1MB ，每次申请新的堆表空间就是申请 heapTableSpace 大小的一个内存块。

EnLargableList 还会保存这样一些字段：

1 appendPtr ， append 指针，存储一个 64位地址， EnLargableList 写入数据时从 append指针指向的数据开始写，每写入一段数据， append 指针会移动到这段数据以后的位置。

2 currentHeapTableSpace ，当前堆表空间，即 append 指针指向的位置所在的堆表空间。这个字段用来归还堆表空间。归还是指，当末尾一个堆表空间，即当前堆表空间的空间所有空闲出来时候，会将堆表空间归还堆。仅仅凭 append 指针不能知道 append 指针所在的堆表空间，因此还须要这个字段来记录 append 指针所在的堆表空间，即当前堆表空间。

3 recycleFreeItem ，碎片回收时指向空闲的项位置，即 “碎片” ，或者说 “已删除”的项。

4 recycleScanItem ，碎片回收时会先扫描 “碎片” ，扫描到一个 “碎片” 以后，会将 recycleFreeItem 指向这个 “碎片” 的位置。而后会扫描堆表项，每扫描一个堆表项，会检查堆表项的子项（子索引项 Free Space项），若子项的位置大于 recycleFreeItem 指向的位置，则将子项移动到 recycleFreeItem 指向的位置， “填补”这个碎片，同时修改当前扫描的堆表项中保存的该子项的位置。这样就完成一个 “碎片” 的回收（“填补”）。

而后就继续扫描下一个 “碎片” ，扫描到 “碎片” 后，又接着扫描上一次扫描的堆表项。怎么知道上一次扫描的堆表项？就是 recycleScanItem 指向的堆表项。不过这样看起来，还要加一个字段，来表示扫描到了堆表项里的哪一个子项，以下：

5 recycleScanSubItem ，表示扫描到的堆表项的子项。这个字段只要 8 位整数就能够了。

6 fragmentCount ，表示 “碎片” 数量，每次删除堆表项时加 1 ，在碎片回收 “填补” 碎片的时候减 1 ，这个字段用于上文中若是 fragmentCount 的数量达到 whenRecycleFragment 的值的时候，就开始碎片回收。

7 堆表空间的 useCount ，这个字段是每一个堆表空间保存 1 个，就是堆表空间的 useCount ，就是堆表空间使用的计数（以堆表项为单位）。每写入 1 个堆表项，就在堆表空间的 useCount 加 1 ，每删除 1 个堆表项， useCount 就减 1 。 useCount 为 0 表示堆表空间

每次分配和回收以后会检查 fragmentCount ，当 fragmentCount 超过 whenRecycleFragment 时会开始回收。因为不但愿回收占用太多时间，能够设定一个参数好比 recycleItemCount ，好比 300 ，表示无论有没有回收完，只扫描 300 个堆表项。

但这样会有一个问题，自己要 fragmentCount 超过 whenRecycleFragment 时才开始回收，并且每次又不回收完，空闲出来的碎片空间得不到重复利用， append 指针只能一直向后移动，因此可能致使永远回收不完，堆表持续增加。

因此 ……

咱们这里有了一个突破，即对于堆表的碎片回收，咱们采用了一个新的算法，就是在堆表项里增长 1 个字段： fragmentNext 。

就是把已删除的堆表项（碎片）用链表的方式链接起来，这样每次写入堆表项的时候从这个链表的头取出一个碎片，做为新的堆表项的写入位置。 fragmentNext 表示下一个碎片的位置，或者说， fragmentNext 是一个指针，指向下一个碎片。

实际上是一个用链表实现的队列。

因此，须要在基础元数据区里增长 2 个字段 fragmentListHead , fragmentListTail ，用于保存碎片链表（队列）的头指针和尾指针。

每次删除堆表项时，将被删除的堆表项的标识字节更新为 0 ，表示已删除，同时将堆表项添加到碎片队列的尾部。

若是是第一次删除，那么碎片队列里尚未元素，则将头指针和尾指针都指向堆表项。

每次写入堆表项的时候，会先从碎片队列里取得碎片，做为写入位置，若是碎片队列为空，才会将 append 指针做为写入位置。

fragmentNext 指针也是一个 64位无符号整数 ( uInt64 ) ，因此也占用 8 个字节。这样的话，索引项和 Free Space 项的大小都是 34 + 8 = 42 个字节了。

好的，如今咱们再来看看在这种算法下，如何回收碎片。（这里的 “碎片” 是指堆表里的碎片，不是堆里的碎片）

实际上，在这个算法下，碎片能够获得充分的利用（每次写入都优先从碎片队列中取得碎片做为写入位置，碎片队列为空才会用 append 指针的方式），因此看起来堆表不会无理增加。但又一些特殊的状况，好比应用程序先申请了大量的小块内存，形成了大量的 Free Space ，为了存储这些 Free Space ，堆表会变得很大，以后应用程序又归还了全部或者大部分内存块，也是 Free Space 会变得不多，此时堆表中就会产生大量空闲空间（碎片），这些空闲空间若是长时间不用又不归还堆，也是一种浪费。

咱们能够这样来设计堆表的碎片回收算法：

首先，只有碎片数量大于某个值的时候，才会开始回收。好比大于 1000 个碎片（约 1 MB）。

从初始空间开始，向后遍历每个堆表空间，若是堆表空间的 useCount 为 0 ，则能够考虑释放这个堆表空间（归还堆）。

注意，这里是考虑，不是必定要归还。还要判断一个条件，就是堆表的可用空间 usableSpace 是否足够，若足够则释放（归还）堆表空间，不然不释放。注意 usableSpace 是整个堆表的可用空间（包括全部的堆表空间）。

堆表的初始空间不属于堆，属于基础元数据区，永远不会释放。

因此在基础元数据区中要增长一个字段 usableSpace ，上文的一些算法逻辑也要作一些修改。

usableSpace 初始值等于初始空间的大小。以后每申请一个新的堆表空间，则加上新的堆表空间的大小，若归还堆表空间，则减去归还的堆表空间的大小。

每次向堆表写入数据， usableSpace 加上写入数据的长度，好比 1 个堆表项长度是 34 个字节，那么写入一个堆表项的话， usableSpace += 34; 。

每次从堆表中删除数据， usableSpace 减去删除数据的长度，好比删除 1 个堆表项，则 usableSpace -= 34; 。

上文中的 append 指针到堆表末尾的空间小于 1500 时应扩充堆表（申请新的堆表空间）这一段须要改为：

usableSpace 小于 1500 时，应扩充堆表（申请新的堆表空间）。上文中也提到若是一个堆表空间的 useCount 为 0 ，则能够考虑释放这个堆表空间，但要判断一个条件，即堆表的可用空间 usableSpace 是否足够。咱们能够设定好比当 usableSpace - 当前考虑释放的堆表空间的大小 > 50 万个字节（能够存储约 500 个 Free Space 项 (包含索引项)）时，能够释放这个堆表空间。

咱们上文设定的 1 个堆表空间的大小是 1MB ，因此 50万个字节约等于 0.5 MB ，上面的条件至关因而释放了这个堆表空间后，堆表的可用空间还有 0.5 MB ，也就是至关于还有半个堆表空间。

这些参数能够根据须要进行设定，上面给出的是参考数值，也是举例。

概括一下，就是 usableSpace 小于 1500 时应扩充堆表， usableSpace - 考虑释放的堆表空间大小大于 50万时能够释放堆表空间。

是否是更清晰了？

碎片回收应放在一个另外的线程里进行。（是否是想起了 GC -_- ' ），每隔一段时间运行一次（好比每秒运行一次），若是堆表空间的数量很大，能够每次只遍历几个堆表空间（好比 10 个），后面的下次继续遍历。这样能够不影响分配和回收内存块的执行速度。

（这里的 “碎片” 是指堆表里的碎片，不是堆里的碎片）

为了能在更新索引时只上溯到索引项值不一样的索引项，须要再在索引项和 Free Space 项里再增长一个字段， parentItem ，保存上一级索引项的地址，是一个 ulong 无符号长整型，占 8 个字节，这样，索引项和 Free Space 项的长度就是 42 + 8 = 50 了。

更新索引时只上溯到索引项值不一样的索引项，能够避免为了更新一个 Free Space 项的索引项而删除这个 Free Space 项的所有索引项并重建所有索引项。删除所有索引项再重建可能会比较省事一些，但效率上可能会低一点。

上溯的逻辑是检查上一级索引项的索引值和新索引在这一层级的索引项的索引值是否相等，若是相等，则在这一级索引项上开始向下创建新索引的索引项，若是不等，则检查这个 “上一级” 索引项除了当前索引项之外还有没有其它子项，若是没有，则删除这个 “上一级” 索引项以后继续上溯，若是有，则直接继续上溯。删除 “上一级” 索引项固然包括了删除当前索引项，实际上，上溯是从 Free Space 项开始， Free Space 项是索引树的最底层，也能够说是叶子节点，也能够说是索引最终指向的数据，或者说数据项。

实际上 “上溯” 这个逻辑好像行不通，由于上溯到索引值和新索引在这一层级的索引值相同这并不能说明更上层的索引值和新索引的对应相同。要知道更上层（或者说每一层）的索引值是否和新索引的对应相同，须要一直上溯到顶层（一级索引），但这和从一级索引自顶而下好像没什么区别。啊哈哈

为了简单起见，咱们采用删除旧索引，创建新索引的方式。即更新索引采用删除旧索引创建新索引的方式。

咱们来看一下这样的作法的时间花费：

对于申请内存块（new），须要更新用于分配内存块的 Free Space 的索引，按照上述的作法，更新包括了删除旧索引和创建新索引，删除旧索引和创建新索引的时间复杂度均可以认为是 O(32) ，加起来就是 O(32) + O(32) = O(32 + 32) = O(64) 。按照咱们在上面的估算方法， O(1) 的时间按 4ns （4纳秒）算，那么申请内存块（new）的时间花费就是 64 * 4 = 256 ns 。 256 ns 咱们按 300ns 算的话， 1 微秒就能够执行 3.3 次 new 操做， 1 秒就能够执行 330 万次 new 操做。由于咱们将 256 ns 近似为 300 ns 计算，因此能够认为 1 秒能够执行 330 万次以上的 new 操做。

对于归还内存块（delete），分为 4 种状况：

状况 1 ：归还的内存块前面和后面都不和已有的 Free Space 相接，因此不须要 “合并”，这样只须要新建索引就行，时间复杂度是 O(32) ，时间花费是 32 * 4 = 128 ns ，能够估算为 1 微秒能够执行 7 次，那么 1 秒能够执行 700 万次。

状况 2 ：归还的内存块前面和已有的 Free Space 相接，须要 “合并”。合并只需更新相接的 Free Space 的结束地址就行。由于索引是按 Free Space 的起始地址创建的，因此更新结束地址不须要更新索引，因此状况 2 的时间复杂度是 O(1) ，因为只是更新结束地址，能够认为 O(1) 的时间花费是 1 * 1ns = 1ns ， 1 秒能够执行 10 亿次。我也有点怀疑，真的这么简单吗？

状况 3 ：归还的内存块后面和已有的 Free Space 相接，须要 “合并”。合并只需更新后面相接的 Free Space 的起始地址，因为索引是按起始地址创建的，因此须要更新索引，和申请内存块同样，更新索引包含删除旧索引和创建新索引，时间复杂度是 O(64) ，时间花费是 64 * 4 = 256ns ， 1 秒能够执行 330 万次以上。

状况 4 ：归还的内存块前面和后面都和已有的 Free Space 相接，须要将前面后面的 Free Space “合并” 为一个。合并须要修改前面的 Free Space 的结束地址，删除后面的 Free Space 。修改结束地址不须要更新索引，因此只须要删除后面的 Free Space 的索引就行。因此时间复杂度是 O(32) ，和状况 1 同样，时间花费是 32 * 4 = 128 ns ， 1 秒能够执行 700 万次。

哎？我刚又想到一个好主意，申请内存块的时候为何不从 Free Space 的结束地址分配呢？若是从 Free Space 的结束地址分配的话，就不用更新索引，只要修改 Free Space 的结束地址就能够了。这样就和归还的状况 2 同样，时间复杂度是 O(1) ，时间花费是 1 * 1ns = 1ns ， 1 秒能够执行 10 亿次。（1 秒能够 new 10 亿次）

上面的讨论是从起始地址开始分配内存块的，因此每次 new 的时候会更新起始地址，也就会更新索引。

若是换成从结束地址一端来分配内存块的话，就不须要更新起始地址，也就不须要更新索引，能够大大提升效率。

固然这是在 Free Space 的大小足够分配的状况下，若是 Free Space 的大小不够，会向后寻找 Free Space，若寻找了 10 个 Free Space 还未找到大小足够的 Free Space，则会向操做系统申请 div 。在这些状况下，还须要考虑这些时间花费。

由于不须要上溯，因此索引项和 Free Space 项不须要保存上一级索引项的位置（地址），也就是不须要 parentItem 这个字段，这样的话，索引项和 Free Space 项的长度就从 50 个字节变回 50 - 8 = 42 个字节了。

实际上，咱们在索引项里设计了一个字段用来保存索引值，但后来发现，由上一级索引保存的 4 个子索引项的指针字段能够直接指向子索引项，子索引项好像不须要保存索引值。

我这个设计是不会回收堆里的碎片的。这跟 C# Java 之类有 GC 的不一样。我想 C++ 也不会回收堆里的碎片。上文提到的 “碎片回收” 是回收堆表里的碎片，不是回收堆的碎片。因此不存在 “全盘整理” 。每次归还内存块的时候会检查 div 的 useCount ，每次分配内存块的时候，这个内存块所在的 div 会 useCount ++ ，每次归还内存块，这个内存块所在的 div 会 useCount -- 。若是 useCount == 0 ，则将 div 归还操做系统。但这种状况几率可能不大，由于一旦 div 投入使用后，分配出去的内存块必须所有释放， div 才会空（useCount == 0），才能归还操做系统。但在实际使用中， div 投入使用后，有申请有归还，所有清空的几率可能不大，很长时间后，可能还有一些 “零碎” 的内存块占据着，即便是少许的内存块，也致使 div 不能归还。这就是 C++ 这一类静态作法的局限。可能致使大块内存区域（div）被进程占据，没法回归到操做系统层面，形成资源的浪费。

因此，要解决这种静态作法的局限，就须要引入 GC 这样的动态特性。我想，当初 GC 的出现（以 Java 为表明），不只仅是为了解决 “内存泄漏” 的问题，其实也隐藏了上述静态作法的种种局限的缘由吧！

固然， GC 的作法会增长工做量，会花费时间，可是， GC 确实能够有效的控制堆碎片数量和堆表大小。就是说， GC 能够使堆碎片控制在一个有限的范围内，使堆表大小控制在一个有限的范围内，这自己就简化了问题，减小了管理开销和复杂度。从这个角度来说， GC 又是减少了时间花费，提高了效率的。

因此，从技术进步或者进化的角度来看， GC 是一次进化，使得能够用更现代更高级的方法来管理存储资源。

相较之下， C++ 的静态作法，是早期和朴素的。

在现代存储资源能够大幅甚至无限扩展的情形下，或许确实须要 GC 这样 “动态” 的方式来管理存储资源。静态的方式面对大幅存储资源可能会有局限。

固然，在本文中设计的这种 “静态”作法，实际上也是利用了现代存储资源大幅提高的特色，比较多的应用了 “空间换时间” 。

但确实存在一个问题，就是静态的作法没法控制碎片的增加，包括堆碎片，甚至堆表碎片，或者说不能有效控制堆表大小的增加。本文的作法能够回收堆表碎片，可是效果如何，不知道。只要堆表空间里还有一个堆表项，就不能释放堆表空间（归还堆），这是一个几率问题。

因此，要准确有效的管理存储资源，仍是须要 GC 这样的 “动态” 作法。

所谓 “动态”，套用一个术语， GC 创建了一个 “抽象层” 。

由于有这个 “抽象层”， GC 能够移动进程中的变量位置，而对于程序来说，没有感受到变化。

也正由于这样， GC 能够有效的控制堆碎片的数量和堆表大小在一个有限的范围。

在 C++ 里，因为 C++ 比较直接的面向 “底层”（操做系统），因此， C++ 不能提供 GC 这样的 “抽象层”，对于堆管理，也就只能使用 “静态”的作法，如上所述。

但到目前为止，上面说的设计解决了基本的分配和回收（包括索引机制，索引机制确保了检索操做的时间花费在一个已知的范围内），但还存在一个重要的问题，就是 “碎片占据 div” 的问题。就是说， div 里只要还有一个内存块没有归还， div 就会被进程一直占用，不能归还操做系统。这就致使大块内存空间的浪费。这是一个大问题。

有网友查了资料，说 Linux 有一块 3G 的用户空间，进程可使用，使用这个用户空间不须要系统调用（不须要切换到系统进程，即不须要跨进程）。个人理解是这是操做系统提供的系统级的一个 “公共堆”，可供全部进程使用。这样在 3G 的范围内，进程能够共用这个公共堆，这样能够解决 “碎片占据 div” 的问题。

因此，我说这是个重大发现。

但后来一想，这样又有一个问题，就是地址访问的时候不能或者难于做安全检测了，所谓安全检测，是指检查访问的地址是否越界。越界指访问了其它进程的内存。

资料显示，如今的安全检测是在存储管理部件中完成的。这是一个硬件，是 CPU 的一部分。

操做系统为存储管理部件设置页表，而后存储管理部件就能够工做了。

看起来，公共堆没有 “段” 的概念，大概很难实施判断是否越界的安全检查。

呀，这可怎么办？

碎片，分为 2 个层面，

1 物理内存，页文件

2 虚拟内存，虚拟地址

对于 1 ，操做系统能够进行整理，能够将多个页上的零碎的数据整理到一个页，再把虚拟地址映射到新的页就行。这样能够避免频繁的载入载出页。

对于 2 ，须要程序本身管理。好比 GC ，内存池。

但上面的说法也有一点问题，操做系统（虚拟内存）也不能整理数据层面的碎片，由于虚拟内存管理的是虚拟页和物理页之间的对应关系，并无细化到虚拟地址和物理页之间的对应关系，因此虚拟内存也不能整理数据层面的碎片，上面说的 “将多个页上的零碎的数据整理到一个页” 这是不能作到的。

操做系统（虚拟内存）只能删除空页（没有数据在用的页）。

而只要页上还有数据在用，那么，即便数据占用的空间很小，这个页也不能被删除。

因此，从这个角度来看，若是程序产生了不少的碎片，那么可能致使操做系统（虚拟内存）频繁的载入载出页。

堆在计算机系统结构里的地位等同于虚拟内存和文件系统。

漫谈 C++ 的 内存堆 实现原理

漫谈 C++ 的内存堆实现原理