太长不看版node
- 跳跃表是有序集合的底层实现之一, 除此以外它在 Redis 中没有其余应用。
- 每一个跳跃表节点的层高都是 1 至 64 之间的随机数
- 层高越高出现的几率越低,层高为i的几率为
。
- 跳跃表中,分值能够重复, 但对象成员惟一。分值相同时,节点按照成员对象的大小进行排序。
本篇解析基于redis 5.0.0版本,本篇涉及源码文件为t_zset.c, server.h。git
跳表是一个随机化的数据结构,实质就是一种能够进行二分查找的有序链表。 github
咱们都知道在有序数组中进行查找,可使用二分查找,将时间复杂度降为O(log n)。可是有序链表作不到,是由于有序链表获取某元素复杂度为O(n),没法经过二分的思想去跳过一些元素的访问。redis
例以下图要查找元素50,就必须 5 -> 6 -> 10 -> 30 -> 49 这样去找,而不能说先看 中心元素49小于50,则开始从中心右边开始查找,跳过元素5,6,10, 30的访问。算法
这时查找元素50变成了 5 -> 49,略过了中间元素6,10, 30。上图中经过首节点存储不一样步长的指针将链表完美二分,可是实际上的跳表却相似与下面这张图的结构,大部分状况喜好不是完美二分的:数组
跳跃表采用了随机算法(层高越高几率越小)来决定层高,相同层之间经过指针相连。redis实现中某节点层高为i的几率为 。数据结构
为何不采用最完美的二分结构? dom
考虑一下,插入节点的状况。当中间插入一个节点,此时的二分结构会被打破,因此须要不断的进行调整。想一想平衡树,红黑树复杂的再平衡操做,而此处的再平衡调整比之有过之而无不及。而使用随机算法进行层高选择的方法也能够实现O(logN)的平均复杂度,并且操做也相对简化的不少。函数
// 层高最大值限制
#define ZSKIPLIST_MAXLEVEL 64 /* Should be enough for 2^64 elements */
// 层高是否继续增加的几率
#define ZSKIPLIST_P 0.25 /* Skiplist P = 1/4 */
// 跳表节点定义
typedef struct zskiplistNode {
// 存储内容
sds ele;
// 分值,用于排序
double score;
// 后退指针
struct zskiplistNode *backward;
// 变长数组,记录层信息。层高越高跳过的节点越多(由于层高越高几率越低)
struct zskiplistLevel {
// 指向当前层下一个节点
struct zskiplistNode *forward;
// 当前节点与forward所指节点中间节点数
unsigned long span;
} level[];
} zskiplistNode;
// 跳表结构管理节点
typedef struct zskiplist {
struct zskiplistNode *header, *tail;
// 长度
unsigned long length;
// 跳表高度(全部节点最高层高)
int level;
} zskiplist;
int zslRandomLevel(void) {
// 计算当前插入元素层高的随机函数
int level = 1;
// (random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF) 几率为1/4
while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
level += 1;
return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}
复制代码
层高为1几率为 1-p(不进while)ui
层高为2的几率为 p(进一次while) * (1 - p)(不进while)
层高为3的几率为 p(进一次while) * p(进一次while) * (1 - p)(不进while)
...
层高为n的几率为
层高的指望
在几率论和统计学中,数学指望(mean)(或均值,亦简称指望)是试验中每次可能结果的几率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小
在redis实现中 p=1/4, 层高指望为E约等于1.33,因此节点的平均层高约等于1.33是个常数,从而得出跳跃表的空间复杂度为O(n)。
zskiplistNode *zslCreateNode(int level, double score, int ele) {
zskiplistNode *zn =
malloc(sizeof(*zn)+level*sizeof(struct zskiplistLevel));
zn->score = score;
zn->ele = ele;
return zn;
}
/* Create a new skiplist. */
zskiplist *zslCreate(void) {
int j;
zskiplist *zsl;
zsl = malloc(sizeof(*zsl));
zsl->level = 1;
zsl->length = 0;
// 头节点层高为64(层高的最大限制)
zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);
for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {
zsl->header->level[j].forward = NULL;
zsl->header->level[j].span = 0;
}
zsl->header->backward = NULL;
zsl->tail = NULL;
return zsl;
}
复制代码
上述代码中能够看到,头节点的层高数组直接为最大长度,由于每次查找都要从头部开始,并且整个跳跃表的高度是动态增长的,初始化时直接按照最大值申请高度,避免后续高度增长时为头节点从新分配内存。因此以前的跳跃表图例应该以下图所示:
int zslRandomLevel(void) {
// 计算当前插入元素层高的随机函数
int level = 1;
// (random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF) 几率为1/4
while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
level += 1;
return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}
zskiplistNode *zslInsert(zskiplist *zsl, double score, sds ele) {
// update存放须要更新的节点
zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
unsigned int rank[ZSKIPLIST_MAXLEVEL];
int i, level;
serverAssert(!isnan(score));
x = zsl->header;
// 第一步,收集须要更新的节点与步长信息
for (i = zsl->level-1; i >= 0; i--) {
/* store rank that is crossed to reach the insert position */
rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];
// score能够重复,重复时使用ele大小进行排序
while (x->level[i].forward &&
(x->level[i].forward->score < score ||
(x->level[i].forward->score == score &&
sdscmp(x->level[i].forward->ele,ele) < 0)))
{
rank[i] += x->level[i].span;
x = x->level[i].forward;
}
update[i] = x;
}
// 第二步, 获取随机层高,补全须要更新的节点
level = zslRandomLevel();
if (level > zsl->level) {
for (i = zsl->level; i < level; i++) {
rank[i] = 0;
update[i] = zsl->header;
update[i]->level[i].span = zsl->length;
}
zsl->level = level;
}
// 第三步,建立并分层插入节点,同时更新同层前一节点步长信息
x = zslCreateNode(level,score,ele);
for (i = 0; i < level; i++) {
x->level[i].forward = update[i]->level[i].forward;
update[i]->level[i].forward = x;
/* update span covered by update[i] as x is inserted here */
x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);
update[i]->level[i].span = (rank[0] - rank[i]) + 1;
}
// 第四步,更新新增节点未涉及层节点的步长信息,以及跳表相关信息
/* increment span for untouched levels */
for (i = level; i < zsl->level; i++) {
update[i]->level[i].span++;
}
x->backward = (update[0] == zsl->header) ? NULL : update[0];
if (x->level[0].forward)
x->level[0].forward->backward = x;
else
zsl->tail = x;
zsl->length++;
return x;
}
复制代码
插入节点分为四步(举个栗子,边吃边看):
建立并分层插入节点,同时更新同层前一节点步长信息
更新新增节点未涉及层节点的步长信息,以及跳表相关信息与节点自身的相关信息
/* Find the rank for an element by both score and key. * Returns 0 when the element cannot be found, rank otherwise. * Note that the rank is 1-based due to the span of zsl->header to the * first element. */
unsigned long zslGetRank(zskiplist *zsl, double score, sds ele) {
zskiplistNode *x;
unsigned long rank = 0;
int i;
x = zsl->header;
for (i = zsl->level-1; i >= 0; i--) {
while (x->level[i].forward &&
(x->level[i].forward->score < score ||
(x->level[i].forward->score == score &&
sdscmp(x->level[i].forward->ele,ele) <= 0))) {
rank += x->level[i].span;
x = x->level[i].forward;
}
/* x might be equal to zsl->header, so test if obj is non-NULL */
if (x->ele && sdscmp(x->ele,ele) == 0) {
return rank;
}
}
return 0;
}
/* Finds an element by its rank. The rank argument needs to be 1-based. */
zskiplistNode* zslGetElementByRank(zskiplist *zsl, unsigned long rank) {
zskiplistNode *x;
unsigned long traversed = 0;
int i;
x = zsl->header;
for (i = zsl->level-1; i >= 0; i--) {
while (x->level[i].forward && (traversed + x->level[i].span) <= rank)
{
traversed += x->level[i].span;
x = x->level[i].forward;
}
if (traversed == rank) {
return x;
}
}
return NULL;
}
复制代码
redis实现中跳跃表和dict共同实现了zset,dict实现O(1)复杂度获取元素对应score,跳跃表用来处理区间查询的相关操做,同时由于score能够重复,因此跳跃表无需实现经过ele获取score(经过dict查)以及经过score获取ele(貌似也没有这个需求)。
通常查询需求有两个:
/* Internal function used by zslDelete, zslDeleteByScore and zslDeleteByRank */
void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {
int i;
for (i = 0; i < zsl->level; i++) {
// 被删除节点在第i层有节点,则update[i]为被删除节点的前一个节点
if (update[i]->level[i].forward == x) {
// 步长 = 原步长 + 被删除节点步长 - 1(被删除节点)
update[i]->level[i].span += x->level[i].span - 1;
// 指针越过被删除节点
update[i]->level[i].forward = x->level[i].forward;
} else {
// 被删除节点在第i层无节点,则 步长 = 原步长 - 1(被删除节点)
update[i]->level[i].span -= 1;
}
}
if (x->level[0].forward) {
// 更新被删除节点下一节点的后退指针
x->level[0].forward->backward = x->backward;
} else {
zsl->tail = x->backward;
}
while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)
zsl->level--;
zsl->length--;
}
int zslDelete(zskiplist *zsl, double score, sds ele, zskiplistNode **node) {
zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
int i;
x = zsl->header;
for (i = zsl->level-1; i >= 0; i--) {
while (x->level[i].forward &&
(x->level[i].forward->score < score ||
(x->level[i].forward->score == score &&
sdscmp(x->level[i].forward->ele,ele) < 0)))
{
x = x->level[i].forward;
}
update[i] = x;
}
/* We may have multiple elements with the same score, what we need * is to find the element with both the right score and object. */
x = x->level[0].forward;
if (x && score == x->score && sdscmp(x->ele,ele) == 0) {
zslDeleteNode(zsl, x, update);
if (!node)
zslFreeNode(x);
else
*node = x;
return 1;
}
return 0; /* not found */
}
复制代码
删除节点与添加节点步骤相似,分为三步: