rocksDB要点

rocksDB定义

快速存储系统,充分挖掘 Flash or RAM 硬件的读写特性,支持单个 KV 的读写以及批量读写。本质:牺牲了一部分读的性能和增加了合并的开销,换取了高效的写性能。

LSM-Tree(Log-Structured-Merge-Tree)的理解

  1. 简述:内存中构建“小树”,到一定的规模,Merge到磁盘的“大树”。
  2. 多level的文件格式:最热最新的数据L0层,最冷最老的数据LN层的布局,磁盘通过B树索引。
  3. B树+“有序文件集”批量写入(定义为同level)
  4. 数据按key有序,合并不同file、level上的数据时,类似merge-join。

 

基本文件格式

  1. memtable:内存文件数据格式,新数据进内存。
  2. sstfile:内容是有序的。
  3. logfile:

放大因子

  1. 写放大:例如,用户写入了10字节,但实际写到磁盘的有100字节。
  2. 读放大:例如,用户要读取一个page,但实际下面读取了3个pages。
  3. 空间放大:数据库可能是100 MB,但实际占用了200 MB的磁盘空间。