原文地址:www.xilidou.com/2018/03/13/…redis
上篇文章写了 Redis 基础数据结构的可变字符串、链表、字典。你们能够点击连接查看。今天咱们继续研究 Redis 的基础数据结构。数据库
当一个集合只包含整数,且这个集合的元素很少的时候,Redis 就会使用整数集合 intset 。首先看 intset 的数据结构:数组
typedef struct intset {
// 编码方式
uint32_t encoding;
// 集合包含的元素数量
uint32_t length;
// 保存元素的数组
int8_t contents[];
} intset;
复制代码
其实 intset 的数据结构比较好理解。一个数据保存元素,length 保存元素的数量,也就是contents的大小,encoding 用于保存数据的编码方式。微信
经过代码咱们能够知道,encoding 的编码类型包括了:数据结构
#define INTSET_ENC_INT16 (sizeof(int16_t))
#define INTSET_ENC_INT32 (sizeof(int32_t))
#define INTSET_ENC_INT64 (sizeof(int64_t))
复制代码
实际上咱们能够看出来。 Redis encoding的类型,就是指数据的大小。做为一个内存数据库,采用这种设计就是为了节约内存。对于一个数据咱们能够画一个图来帮助理解:并发
既然有从小到大的三个数据结构,在插入数据的时候尽量使用小的数据结构来节约内存,若是插入的数据大于原有的数据结构,就会触发扩容。学习
扩容有三个步骤:ui
整数集合不支持降级操做,一旦升级就不能降级了。编码
跳跃表是链表的一种,是一种利用空间换时间的数据结构。跳表平均支持 O(logN),最坏O(N)复杂度的查找。spa
跳表是由一个zskiplist 和 多个 zskiplistNode 组成。咱们先看看他们的结构:
/* ZSETs use a specialized version of Skiplists */
/* * 跳跃表节点 */
typedef struct zskiplistNode {
// 成员对象
robj *obj;
// 分值
double score;
// 后退指针
struct zskiplistNode *backward;
// 层
struct zskiplistLevel {
// 前进指针
struct zskiplistNode *forward;
// 跨度
unsigned int span;
} level[];
} zskiplistNode;
/* * 跳跃表 */
typedef struct zskiplist {
// 表头节点和表尾节点
struct zskiplistNode *header, *tail;
// 表中节点的数量
unsigned long length;
// 表中层数最大的节点的层数
int level;
} zskiplist;
复制代码
因此根据这个代码咱们能够画出以下的结构图:
其实跳表就是一个利用空间换时间的数据结构,利用 level 做为链表的索引。
以前有人问过 Redis 的做者 为何使用跳跃表,而不是 tree 来构建索引?做者的回答是:
压缩链表 Redis 做者的介绍是,为了尽量节约内存设计出来的双向链表。
对于一个压缩列表代码里注释给出的数据结构以下:
zlbytes
表示的是整个压缩列表使用的内存字节数
zltail
指定了压缩列表的尾节点的偏移量
zllen
是压缩列表 entry 的数量
entry
就是 ziplist 的节点
zlend
标记压缩列表的末端
这个列表中还有单个指针:
ZIPLIST_ENTRY_HEAD
列表开始节点的头偏移量
ZIPLIST_ENTRY_TAIL
列表结束节点的头偏移量
ZIPLIST_ENTRY_END
列表的尾节点结束的偏移量
再看看一个 entry 的结构:
/* * 保存 ziplist 节点信息的结构 */
typedef struct zlentry {
// prevrawlen :前置节点的长度
// prevrawlensize :编码 prevrawlen 所需的字节大小
unsigned int prevrawlensize, prevrawlen;
// len :当前节点值的长度
// lensize :编码 len 所需的字节大小
unsigned int lensize, len;
// 当前节点 header 的大小
// 等于 prevrawlensize + lensize
unsigned int headersize;
// 当前节点值所使用的编码类型
unsigned char encoding;
// 指向当前节点的指针
unsigned char *p;
} zlentry;
复制代码
依次解释一下这几个参数。
prevrawlen
前置节点的长度,这里多了一个 size,实际上是记录了 prevrawlen 的尺寸。Redis 为了节约内存并非直接使用默认的 int 的长度,而是逐渐升级的。 同理 len
记录的是当前节点的长度,lensize
记录的是 len 的长度。 headersize
就是前文提到的两个 size 之和。 encoding
就是这个节点的数据类型。这里注意一下 encoding 的类型只包括整数和字符串。 p
节点的指针,不用过多的解释。
须要注意一点,由于每一个节点都保存了前一个节点的长度,若是发生了更新或者删除节点,则这个节点以后的数据也须要修改,有一种最坏的状况就是若是每一个节点都处于须要扩容的零界点,就会形成这个节点以后的节点都要修改 size 这个参数,引起连锁反应。这个时候就是 压缩链表最坏的时间复杂度 O(n^2)。不过全部节点都处于临界值,这样的几率能够说比较小。
至此Redis的基本数据结构就介绍完了。咱们能够看到 Redis 对内存的使用真是“斤斤计较”,对于内存是使用特别节约。同时 Redis 做为一个单线程应用,不用考虑并发的问题,将不少相似 size 或者 length 的参数暴露出来,将不少 O(n) 的操做下降为 O(1)。大大提高效率。下一讲,将会介绍 Redis 是怎么经过这些数据结构向外提供服务。 Redis 的代码真是写的太棒了,简洁高效。值得你们学习。
欢迎关注个人微信公众号: