Redis 的基础数据结构（二）整数集合、跳跃表、压缩列表

时间 2019-11-29

原文原文链接

原文地址：www.xilidou.com/2018/03/13/…redis

上篇文章写了 Redis 基础数据结构的可变字符串、链表、字典。你们能够点击连接查看。今天咱们继续研究 Redis 的基础数据结构。数据库

整数集合
跳跃表
压缩列表

整数集合

当一个集合只包含整数，且这个集合的元素很少的时候，Redis 就会使用整数集合 intset 。首先看 intset 的数据结构：数组

typedef struct intset {
    
    // 编码方式
    uint32_t encoding;

    // 集合包含的元素数量
    uint32_t length;

    // 保存元素的数组
    int8_t contents[];
} intset;

复制代码

其实 intset 的数据结构比较好理解。一个数据保存元素，length 保存元素的数量，也就是contents的大小，encoding 用于保存数据的编码方式。微信

经过代码咱们能够知道，encoding 的编码类型包括了：数据结构

#define INTSET_ENC_INT16 (sizeof(int16_t))
#define INTSET_ENC_INT32 (sizeof(int32_t))
#define INTSET_ENC_INT64 (sizeof(int64_t))
复制代码

实际上咱们能够看出来。 Redis encoding的类型，就是指数据的大小。做为一个内存数据库，采用这种设计就是为了节约内存。对于一个数据咱们能够画一个图来帮助理解：并发

既然有从小到大的三个数据结构，在插入数据的时候尽量使用小的数据结构来节约内存，若是插入的数据大于原有的数据结构，就会触发扩容。学习

扩容有三个步骤：ui

根据新元素的类型，修改整个数组的数据类型，并从新分配空间
将原有的的数据，装换为新的数据类型，从新放到应该在的位置上，且保存顺序性
再插入新元素

整数集合不支持降级操做，一旦升级就不能降级了。编码

跳跃表

跳跃表是链表的一种，是一种利用空间换时间的数据结构。跳表平均支持 O(logN)，最坏O(N)复杂度的查找。spa

跳表是由一个zskiplist 和多个 zskiplistNode 组成。咱们先看看他们的结构：

/* ZSETs use a specialized version of Skiplists */
/* * 跳跃表节点 */
typedef struct zskiplistNode {

    // 成员对象
    robj *obj;

    // 分值
    double score;

    // 后退指针
    struct zskiplistNode *backward;

    // 层
    struct zskiplistLevel {

        // 前进指针
        struct zskiplistNode *forward;

        // 跨度
        unsigned int span;

    } level[];

} zskiplistNode;

/* * 跳跃表 */
typedef struct zskiplist {

    // 表头节点和表尾节点
    struct zskiplistNode *header, *tail;

    // 表中节点的数量
    unsigned long length;

    // 表中层数最大的节点的层数
    int level;

} zskiplist;

复制代码

因此根据这个代码咱们能够画出以下的结构图：

其实跳表就是一个利用空间换时间的数据结构，利用 level 做为链表的索引。

以前有人问过 Redis 的做者为何使用跳跃表，而不是 tree 来构建索引？做者的回答是：

省内存。
服务于 ZRANGE 或者 ZREVRANGE 是一个典型的链表场景。时间复杂度的表现和平衡树差很少。
最重要的一点是跳跃表的实现很简单就能达到 O(logN)的级别。

压缩列表

压缩链表 Redis 做者的介绍是，为了尽量节约内存设计出来的双向链表。

对于一个压缩列表代码里注释给出的数据结构以下：

zlbytes 表示的是整个压缩列表使用的内存字节数

zltail 指定了压缩列表的尾节点的偏移量

zllen 是压缩列表 entry 的数量

entry 就是 ziplist 的节点

zlend 标记压缩列表的末端

这个列表中还有单个指针：

ZIPLIST_ENTRY_HEAD 列表开始节点的头偏移量

ZIPLIST_ENTRY_TAIL 列表结束节点的头偏移量

ZIPLIST_ENTRY_END 列表的尾节点结束的偏移量

再看看一个 entry 的结构：

/* * 保存 ziplist 节点信息的结构 */
typedef struct zlentry {

    // prevrawlen ：前置节点的长度
    // prevrawlensize ：编码 prevrawlen 所需的字节大小
    unsigned int prevrawlensize, prevrawlen;

    // len ：当前节点值的长度
    // lensize ：编码 len 所需的字节大小
    unsigned int lensize, len;

    // 当前节点 header 的大小
    // 等于 prevrawlensize + lensize
    unsigned int headersize;

    // 当前节点值所使用的编码类型
    unsigned char encoding;

    // 指向当前节点的指针
    unsigned char *p;

} zlentry;

复制代码

依次解释一下这几个参数。

prevrawlen 前置节点的长度，这里多了一个 size，实际上是记录了 prevrawlen 的尺寸。Redis 为了节约内存并非直接使用默认的 int 的长度，而是逐渐升级的。同理 len 记录的是当前节点的长度，lensize 记录的是 len 的长度。 headersize 就是前文提到的两个 size 之和。 encoding 就是这个节点的数据类型。这里注意一下 encoding 的类型只包括整数和字符串。 p 节点的指针，不用过多的解释。

须要注意一点，由于每一个节点都保存了前一个节点的长度，若是发生了更新或者删除节点，则这个节点以后的数据也须要修改，有一种最坏的状况就是若是每一个节点都处于须要扩容的零界点，就会形成这个节点以后的节点都要修改 size 这个参数，引起连锁反应。这个时候就是压缩链表最坏的时间复杂度 O(n^2)。不过全部节点都处于临界值，这样的几率能够说比较小。

总结

至此Redis的基本数据结构就介绍完了。咱们能够看到 Redis 对内存的使用真是“斤斤计较”，对于内存是使用特别节约。同时 Redis 做为一个单线程应用，不用考虑并发的问题，将不少相似 size 或者 length 的参数暴露出来，将不少 O(n) 的操做下降为 O(1)。大大提高效率。下一讲，将会介绍 Redis 是怎么经过这些数据结构向外提供服务。 Redis 的代码真是写的太棒了，简洁高效。值得你们学习。

欢迎关注个人微信公众号：

Redis 的基础数据结构（二） 整数集合、跳跃表、压缩列表

整数集合

跳跃表

压缩列表

总结

Redis 的基础数据结构（二）整数集合、跳跃表、压缩列表