redis源码解析-基础数据-skiplist(跳跃表)

时间 2019-11-26

标签 redis 源码解析基础数据 skiplist 跳跃栏目 Redis 繁體版

原文原文链接

太长不看版node

跳跃表是有序集合的底层实现之一，除此以外它在 Redis 中没有其余应用。

每一个跳跃表节点的层高都是 1 至 64 之间的随机数

层高越高出现的几率越低，层高为i的几率为 $(1-p) * p^{i-1}, (p=1/4)$ 。

跳跃表中，分值能够重复，但对象成员惟一。分值相同时，节点按照成员对象的大小进行排序。

本篇解析基于redis 5.0.0版本，本篇涉及源码文件为t_zset.c, server.h。git

什么是跳跃表

跳表是一个随机化的数据结构，实质就是一种能够进行二分查找的有序链表。 github

咱们都知道在有序数组中进行查找，可使用二分查找，将时间复杂度降为O(log n)。可是有序链表作不到，是由于有序链表获取某元素复杂度为O(n)，没法经过二分的思想去跳过一些元素的访问。redis

例以下图要查找元素50,就必须 5 -> 6 -> 10 -> 30 -> 49 这样去找，而不能说先看中心元素49小于50，则开始从中心右边开始查找，跳过元素5，6，10， 30的访问。算法

而跳跃表则是经过在节点中提取索引的方式，实现有序链表的快速查找。本质上是一个空间(额外的步进指针)换时间的操做。例以下图：

这时查找元素50变成了 5 -> 49,略过了中间元素6，10， 30。上图中经过首节点存储不一样步长的指针将链表完美二分，可是实际上的跳表却相似与下面这张图的结构,大部分状况喜好不是完美二分的：数组

跳跃表采用了随机算法(层高越高几率越小)来决定层高，相同层之间经过指针相连。redis实现中某节点层高为i的几率为 $(1-p) * p^{i-1}$ 。数据结构

为何不采用最完美的二分结构？ dom

考虑一下，插入节点的状况。当中间插入一个节点，此时的二分结构会被打破，因此须要不断的进行调整。想一想平衡树，红黑树复杂的再平衡操做，而此处的再平衡调整比之有过之而无不及。而使用随机算法进行层高选择的方法也能够实现O(logN)的平均复杂度，并且操做也相对简化的不少。函数

跳跃表(redis实现)的空间复杂度

跳跃表(redis实现)相关操做

建立跳跃表

zskiplistNode *zslCreateNode(int level, double score, int ele) {
    zskiplistNode *zn =
        malloc(sizeof(*zn)+level*sizeof(struct zskiplistLevel));
    zn->score = score;
    zn->ele = ele;
    return zn;
}

/* Create a new skiplist. */
zskiplist *zslCreate(void) {
    int j;
    zskiplist *zsl;

    zsl = malloc(sizeof(*zsl));
    zsl->level = 1;
    zsl->length = 0;
    // 头节点层高为64(层高的最大限制)
    zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);
    for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {
        zsl->header->level[j].forward = NULL;
        zsl->header->level[j].span = 0;
    }
    zsl->header->backward = NULL;
    zsl->tail = NULL;
    return zsl;
}
复制代码

上述代码中能够看到，头节点的层高数组直接为最大长度，由于每次查找都要从头部开始，并且整个跳跃表的高度是动态增长的，初始化时直接按照最大值申请高度，避免后续高度增长时为头节点从新分配内存。因此以前的跳跃表图例应该以下图所示：

由于有backward指针的存在，因此第一层能够看做是一个双向链表。

插入节点

int zslRandomLevel(void) {
    // 计算当前插入元素层高的随机函数
    int level = 1;
    // (random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF) 几率为1/4
    while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
        level += 1;
    return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}

zskiplistNode *zslInsert(zskiplist *zsl, double score, sds ele) {
    // update存放须要更新的节点
    zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
    unsigned int rank[ZSKIPLIST_MAXLEVEL];
    int i, level;

    serverAssert(!isnan(score));
    x = zsl->header;
    // 第一步，收集须要更新的节点与步长信息
    for (i = zsl->level-1; i >= 0; i--) {
        /* store rank that is crossed to reach the insert position */
        rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];
        // score能够重复，重复时使用ele大小进行排序
        while (x->level[i].forward &&
                (x->level[i].forward->score < score ||
                    (x->level[i].forward->score == score &&
                    sdscmp(x->level[i].forward->ele,ele) < 0)))
        {
            rank[i] += x->level[i].span;
            x = x->level[i].forward;
        }
        update[i] = x;
    }
    // 第二步， 获取随机层高，补全须要更新的节点
    level = zslRandomLevel();
    if (level > zsl->level) {
        for (i = zsl->level; i < level; i++) {
            rank[i] = 0;
            update[i] = zsl->header;
            update[i]->level[i].span = zsl->length;
        }
        zsl->level = level;
    }
    // 第三步，建立并分层插入节点，同时更新同层前一节点步长信息
    x = zslCreateNode(level,score,ele);
    for (i = 0; i < level; i++) {
        x->level[i].forward = update[i]->level[i].forward;
        update[i]->level[i].forward = x;

        /* update span covered by update[i] as x is inserted here */
        x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);
        update[i]->level[i].span = (rank[0] - rank[i]) + 1;
    }
    // 第四步，更新新增节点未涉及层节点的步长信息，以及跳表相关信息
    /* increment span for untouched levels */
    for (i = level; i < zsl->level; i++) {
        update[i]->level[i].span++;
    }

    x->backward = (update[0] == zsl->header) ? NULL : update[0];
    if (x->level[0].forward)
        x->level[0].forward->backward = x;
    else
        zsl->tail = x;
    zsl->length++;
    return x;
}
复制代码

插入节点分为四步(举个栗子，边吃边看)：

假设如今我须要插入元素80，且获取到随机的层高为5( 为了全部状况都覆盖到)。

收集须要更新的节点与步长信息
- 将插入新增节点后每层受影响节点存在update数组中，update[i]为第i + 1层会受影响节点(红框框出来的就是例子中可能会受影响的节点)。
- 将每层头节点与会受影响的节点中间存在节点数存在rank数组中，rank[i]为头节点与第i + 1层会受影响节点中间存在的节点数(rank为[6, 5, 3, 3])。

获取随机层高，补全须要更新的节点，同时可能更新跳表高度
- 经过zslRandomLevel函数计算当前插入节点侧层高，层高越高出现的概率越小(咱们指定了是5，实际是随机的)。
- 由于搜索须要更新节点是从跳跃表当前高度的那一层开始的，若是新插入的节点的层高比当前表高还高，那么高出的这几层的头节点也是须要更新信息的(第五层的头节点后继有人了，因此它也须要被更新)。
- 若是当前层高高于表高，则更新表高(表高从4变成5)。

建立并分层插入节点，同时更新同层前一节点步长信息
- 建立节点，而后根据当前节点的层高，在每一层进行节点插入(和简单链表插入同样)。
- 更新下每层前一个节点(update[i]对应节点)与自身节点的步长信息。
更新新增节点未涉及层节点的步长信息，以及跳表相关信息与节点自身的相关信息
- 若是当前节点的层高比跳表高度低，那么高于当前节点层高的那些层中排在当前节点以后的节点步长信息都须要+1(由于在它和它的前一个节点之间插入了新元素)。
- 更新跳表长度与当前节点与第一层下一节点的后退指针(后退指针能够理解为只有底层链表有)。

查找节点

/* Find the rank for an element by both score and key. * Returns 0 when the element cannot be found, rank otherwise. * Note that the rank is 1-based due to the span of zsl->header to the * first element. */
unsigned long zslGetRank(zskiplist *zsl, double score, sds ele) {
    zskiplistNode *x;
    unsigned long rank = 0;
    int i;

    x = zsl->header;
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward &&
            (x->level[i].forward->score < score ||
                (x->level[i].forward->score == score &&
                sdscmp(x->level[i].forward->ele,ele) <= 0))) {
            rank += x->level[i].span;
            x = x->level[i].forward;
        }

        /* x might be equal to zsl->header, so test if obj is non-NULL */
        if (x->ele && sdscmp(x->ele,ele) == 0) {
            return rank;
        }
    }
    return 0;
}

/* Finds an element by its rank. The rank argument needs to be 1-based. */
zskiplistNode* zslGetElementByRank(zskiplist *zsl, unsigned long rank) {
    zskiplistNode *x;
    unsigned long traversed = 0;
    int i;

    x = zsl->header;
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward && (traversed + x->level[i].span) <= rank)
        {
            traversed += x->level[i].span;
            x = x->level[i].forward;
        }
        if (traversed == rank) {
            return x;
        }
    }
    return NULL;
}
复制代码

redis实现中跳跃表和dict共同实现了zset，dict实现O(1)复杂度获取元素对应score，跳跃表用来处理区间查询的相关操做，同时由于score能够重复，因此跳跃表无需实现经过ele获取score(经过dict查)以及经过score获取ele(貌似也没有这个需求)。

通常查询需求有两个：

根据rank查询节点，主要是为了经过该节点指针进行遍历获取某个区间的节点数据。
根据score与ele(score可能重复，因此须要ele)获取节点的rank,进行count之类的数值计算。

大致的流程都是按照从左上方开始向右下方搜索的路线进行查询( 如上图红线标记路径)。

删除节点

/* Internal function used by zslDelete, zslDeleteByScore and zslDeleteByRank */
void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {
    int i;
    for (i = 0; i < zsl->level; i++) {
        // 被删除节点在第i层有节点，则update[i]为被删除节点的前一个节点
        if (update[i]->level[i].forward == x) {
            // 步长 = 原步长 + 被删除节点步长 - 1（被删除节点）
            update[i]->level[i].span += x->level[i].span - 1;
            // 指针越过被删除节点
            update[i]->level[i].forward = x->level[i].forward;
        } else {
            // 被删除节点在第i层无节点，则 步长 = 原步长 - 1(被删除节点)
            update[i]->level[i].span -= 1;
        }
    }
    if (x->level[0].forward) {
        // 更新被删除节点下一节点的后退指针
        x->level[0].forward->backward = x->backward;
    } else {
        zsl->tail = x->backward;
    }
    while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)
        zsl->level--;
    zsl->length--;
}

int zslDelete(zskiplist *zsl, double score, sds ele, zskiplistNode **node) {
    zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
    int i;

    x = zsl->header;
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward &&
                (x->level[i].forward->score < score ||
                    (x->level[i].forward->score == score &&
                     sdscmp(x->level[i].forward->ele,ele) < 0)))
        {
            x = x->level[i].forward;
        }
        update[i] = x;
    }
    /* We may have multiple elements with the same score, what we need * is to find the element with both the right score and object. */
    x = x->level[0].forward;
    if (x && score == x->score && sdscmp(x->ele,ele) == 0) {
        zslDeleteNode(zsl, x, update);
        if (!node)
            zslFreeNode(x);
        else
            *node = x;
        return 1;
    }
    return 0; /* not found */
}
复制代码

删除节点与添加节点步骤相似，分为三步：

收集须要更新的节点。
删除节点所在的层链表移除节点(和简单链表移除节点同样)，并更新前一节点的步长信息(update[i]所存节点)。
更新跳跃表高度与长度。