GitHub: https://github.com/storagezhangc++
Emai: debugzhang@163.comgit
华为云社区: https://bbs.huaweicloud.com/blogs/250328github
LevelDB: https://github.com/google/leveldb函数
内存池的存在主要就是减小调用 malloc
或者 new
的次数,减小内存分配所带来的系统开销,提高性能。性能
LevelDB 中的内存池是由类 Arena
实现的。Arena
先向系统申请一块大的内存,当其余组件须要申请内存时,Arena
先将已有的内存块分配给组件,若是不够用则再申请一块大的内存。当内存池对象析构时,分配的内存均被释放,这保证了内存不会泄漏。fetch
申请内存和分配内存的区别:ui
// 指向当前内存块未分配内存的起始地址的指针 char* alloc_ptr_; // 记录当前内存块未分配内存的大小 size_t alloc_bytes_remaining_; // 每一个内存块的地址都存储在 vector 中 std::vector<char*> blocks_; // 原子变量:记录当前对象的内存总量 std::atomic<size_t> memory_usage_;
如图所示,Arena
的成员变量 blocks_
存储若干个指针,每一个指针指向一块内存。alloc_ptr_
指向当前内存块未分配内存的起始地址,alloc_bytes_remaining_
为当前内存块未分配内存的大小。google
static const int kBlockSize = 4096;
Arena
之内存块为单位来管理内存,每一个内存块的大小 kBlockSize
为 4096 KB。atom
Arena::Arena() : alloc_ptr_(nullptr), alloc_bytes_remaining_(0), memory_usage_(0) {} Arena::~Arena() { for (size_t i = 0; i < blocks_.size(); i++) { delete[] blocks_[i]; } }
构造函数初始化全部的成员变量,保证不会使用未初始化的变量。spa
析构函数释放 blocks_
中每一个指针指向的内存块。
Arena
提供了 3 个 public
函数来简化内存分配。
Arena
的内存分配策略有三种,当申请 bytes
大小的内存时:
bytes
小于等于当前内存块剩余内存,直接在当前内存块上分配内存;bytes
大于当前内存块剩余内存,调用 AllocateFallback
函数按照另外两种分配策略分配内存。inline char* Arena::Allocate(size_t bytes) { // 不须要分配 0 字节的内存 assert(bytes > 0); // 申请的内存小于当前内存块剩余的内存,直接在当前内存块上分配内存 if (bytes <= alloc_bytes_remaining_) { char* result = alloc_ptr_; // 从当前内存块中分配内存 alloc_ptr_ += bytes; // 计算当前内存块的剩余内存大小 alloc_bytes_remaining_ -= bytes; return result; } // 申请的内存大于当前内存块剩余的内存,使用 AllocateFallback 函数从新申请内存 return AllocateFallback(bytes); }
Allocate
函数分配 bytes
大小的内存空间,返回指向所分配内存的指针。
char* Arena::AllocateAligned(size_t bytes) { // 计算当前机器要对齐的字节数,最多 8 字节对齐,不然就按照当前机器的 void* 的大小来对齐 const int align = (sizeof(void*) > 8) ? sizeof(void*) : 8; // 字节对齐必须是 2 的次幂 // x & (x - 1) = 0 表示 x 是 2 的次幂 static_assert((align & (align - 1)) == 0, "Pointer size should be a power of 2"); // A & (B - 1) = A % B // reinterpret_cast<uintptr_t> 类型对应机器指针大小 size_t current_mod = reinterpret_cast<uintptr_t>(alloc_ptr_) & (align - 1); // 若是 current_mod = 0 表示 alloc_ptr_ 已是字节对齐的 // 不然计算 align - current_mod,表示当前指针地址距离字节对齐的误差 size_t slop = (current_mod == 0 ? 0 : align - current_mod); // 当前须要分配的字节大小加上对齐误差就是最终须要分配的总大小 size_t needed = bytes + slop; char* result; // 所需的内存小于当前内存块剩余的内存,直接在当前内存块上分配内存 if (needed <= alloc_bytes_remaining_) { result = alloc_ptr_ + slop; alloc_ptr_ += needed; alloc_bytes_remaining_ -= needed; } else { // 所需的内存大于当前内存块剩余的内存,使用 AllocateFallback 函数从新申请内存 result = AllocateFallback(bytes); } // 保证分配的内存起始地址是字节对齐的 assert((reinterpret_cast<uintptr_t>(result) & (align - 1)) == 0); return result; }
AllocateAligned
函数分配 bytes
大小的内存空间,且起始地址字节对齐,返回指向所分配内存的指针。
size_t MemoryUsage() const { return memory_usage_.load(std::memory_order_relaxed); }
MemoryUsage
函数返回当前分配给 Arena
对象的全部内存空间大小和全部指向内存块的指针大小之和。
接上节中的 Arena
的内存分配策略,当申请 bytes
大小的内存时:
bytes
小于等于当前内存块剩余内存,直接在当前内存块上分配内存;bytes
大于当前内存块剩余内存:
bytes
小于等于默认内存块大小的四分之一,新申请一个内存块,大小为默认内存块大小,在该内存块上分配内存;bytes
大于默认内存块大小的四分之一,新申请一个内存块,大小为 bytes
,分配内存。char* Arena::AllocateFallback(size_t bytes) { // 调用 AllocateNewBlock 申请一块大小为 bytes 的新内存块 if (bytes > kBlockSize / 4) { // 在新申请的内存块中分配所有内存 char* result = AllocateNewBlock(bytes); return result; } // 调用 AllocateNewBlock 申请一块大小为 kBlockSize 的新内存块 alloc_ptr_ = AllocateNewBlock(kBlockSize); alloc_bytes_remaining_ = kBlockSize; // 在新申请的内存块中分配 bytes 大小的内存 char* result = alloc_ptr_; alloc_ptr_ += bytes; alloc_bytes_remaining_ -= bytes; return result; }
当申请的内存大于当前内存块剩余内存时,AllocateFallback
函数会被调用,用来按照后两种分配策略分配内存。
这两种分配策略能够进一步减小内存分配的次数,但同时每块最后 \(\frac{1}{4}\) 的空间有可能会被浪费。
char* Arena::AllocateNewBlock(size_t block_bytes) { // 申请一个大小为 block_bytes 的内存块 char* result = new char[block_bytes]; // 将该内存块的地址添加到 blocks 中 blocks_.push_back(result); // 记录当前对象内存分配总量 memory_usage_.fetch_add(block_bytes + sizeof(char*), std::memory_order_relaxed); return result; }
AllocateNewBlock
函数申请一个大小为 block_bytes
的内存块。
当向 Arena
申请 bytes
大小的内存时:
bytes
小于等于当前内存块剩余内存,直接在当前内存块上分配内存;bytes
大于当前内存块剩余内存:
bytes
小于等于默认内存块大小的四分之一,新申请一个内存块,大小为默认内存块大小,在该内存块上分配内存;bytes
大于默认内存块大小的四分之一,新申请一个内存块,大小为 bytes
,分配内存。