Redis:底层数据结构分析

时间 2019-11-16

标签 redis 底层数据结构分析栏目 Redis 繁體版

原文原文链接

[TOC]html

判断值类型: object encoding keyname算法

127.0.0.1:6379> set k1  str
OK
127.0.0.1:6379> set k2 123
OK
127.0.0.1:6379> Object encoding  k1
"embstr"
127.0.0.1:6379> Object encoding  k2
"int"
127.0.0.1:6379> lpush list1 1 2 3
(integer) 3
127.0.0.1:6379> Object encoding list1
"quicklist"
127.0.0.1:6379> hset testhash key1 009
(integer) 1
127.0.0.1:6379> object encoding testhash
"ziplist"
127.0.0.1:6379> hset testhash key2 00ososkskkalalkskskaaakasmasd,jansm,namsnasnda,msn,akdwj,kjallllllaaaaassjjjjjjjjacacascascascmnascaksc,ascmascna,klna,cksa,cksans,can,scamcs9
(integer) 1
127.0.0.1:6379> object encoding testhash
"hashtable"
127.0.0.1:6379>
复制代码

数据结构数据库

数据结构	定义常量	值
整数类型	REDIS_ENCODING_INT	"int"
embstr字符串类型	REDIS_ENCODING_EMBSTR	"embstr"
简单动态字符串	REDIS_ENCODING_RAW	"raw"
字典类型	REDIS_ENCODING_HT	"hashtable"
双端链表	REDIS_ENCODING_LINKEDLIST	"linkedlist"
压缩列表	REDIS_ENCODING_ZIPLIST	"ziplist"
整数集合	REDIS_ENCODING_INTSET	"intset"
跳表和字典	REDIS_ENCODING_SKIPLIST	"skiplist"

对应关系数组

1. string  ==> raw|embstr|int
2. list ==> quicklist
3. hash ==> ziplist|hashtable
4. set ==> intset|hashtable
5. zset ==> ziplist|skiplist
6. stream => stream
复制代码

1.SDS(simple dynamic string)简单动态字符串

结构定义

struct sdshdr{
     //记录buf数组中已使用字节的数量
     //等于 SDS 保存字符串的长度
     int len;
     //记录 buf 数组中未使用字节的数量
     int free;
     //字节数组，用于保存字符串
     char buf[];
}
复制代码

SDS保存的字符串结构图示：安全

优点

常数复杂度获取字符串长度bash
- 因为 len 属性的存在，咱们获取 SDS 字符串的长度只须要读取 len 属性，时间复杂度为 O(1)。而对于 C 语言，获取字符串的长度一般是通过遍历计数来实现的，时间复杂度为 O(n)。经过 strlen key 命令能够获取 key 的字符串长度。
杜绝缓冲区溢出数据结构
- 在 C 语言中使用 strcat 函数来进行两个字符串的拼接，一旦没有分配足够长度的内存空间，就会形成缓冲区溢出。而对于 SDS 数据类型，在进行字符修改的时候，会首先根据记录的 len 属性检查内存空间是否知足需求，若是不知足，会进行相应的空间扩展，而后在进行修改操做，因此不会出现缓冲区溢出。
减小修改字符串的内存从新分配次数函数
二进制安全ui
兼容部分C字符串函数

SDS 除了保存数据库中的字符串值之外，SDS 还能够做为缓冲区（buffer）：包括 AOF 模块中的AOF缓冲区以及客户端状态中的输入缓冲区

2.链表

链表的定义

//链表节点
typedef  struct listNode{
       //前置节点
       struct listNode *prev;
       //后置节点
       struct listNode *next;
       //节点的值
       void *value;  
}listNode
复制代码

经过多个 listNode 结构就能够组成链表，这是一个双端链表，Redis还提供了操做链表的数据结构：

typedef struct list{
     //表头节点
     listNode *head;
     //表尾节点
     listNode *tail;
     //链表所包含的节点数量
     unsigned long len;
     //节点值复制函数
     void (*free) (void *ptr);
     //节点值释放函数
     void (*free) (void *ptr);
     //节点值对比函数
     int (*match) (void *ptr,void *key);
}list;
复制代码

链表特性
- 双端：链表具备前置节点和后置节点的引用，获取这两个节点的时间复杂度都为O(1)
- 无环：表头节点的prev指针和表节点的next指针向NULL
- 长度计数器：获取长度时间复杂度O(1)
- 多态：链表节点使用void*指针来保存节点值，能够保存不一样类型的值

3.字典

字典又称为符号表或者关联数组、或映射（map），是一种用于保存键值对的抽象数据结构。字典中的每个键 key 都是惟一的，经过 key 能够对值来进行查找或修改。 - - Redis 的字典使用哈希表做为底层实现

哈希表结构定义

typedef struct dictht{
     //哈希表数组
     dictEntry **table;
     //哈希表大小
     unsigned long size;
     //哈希表大小掩码，用于计算索引值
     //老是等于 size-1
     unsigned long sizemask;
     //该哈希表已有节点的数量
     unsigned long used;
 
}dictht
复制代码

哈希表是由数组 table 组成，table 中每一个元素都是指向 dict.h/dictEntry 结构，dictEntry 结构定义以下：

typedef struct dictEntry{
     //键
     void *key;
     //值
     union{
          void *val;
          uint64_tu64;
          int64_ts64;
     }v;
     //指向下一个哈希表节点，造成链表
     struct dictEntry *next;
}dictEntry
复制代码

key 用来保存键，val 属性用来保存值，值能够是一个指针，也能够是uint64_t整数，也能够是int64_t整数。

注意这里还有一个指向下一个哈希表节点的指针，咱们知道哈希表最大的问题是存在哈希冲突，如何解决哈希冲突，有开放地址法和链地址法。这里采用的即是链地址法，经过next这个指针能够将多个哈希值相同的键值对链接在一块儿，用来解决哈希冲突。

字典特性

哈希算法：Redis计算哈希值和索引值方法以下：

#一、使用字典设置的哈希函数，计算键 key 的哈希值
hash = dict->type->hashFunction(key);
#二、使用哈希表的sizemask属性和第一步获得的哈希值，计算索引值
index = hash & dict->ht[x].sizemask;
复制代码

解决哈希冲突: 链地址法，经过字典里面的 *next 指针指向下一个具备相同索引值的哈希表节点。
扩容和收缩：当哈希表保存的简直对太多或太少的时候，就须要经过rehash(从新散列)来对哈希表进行相应的扩展或者收缩。具体步骤：
- 3.1. 扩展操做：每次扩展都是根据原哈希表已使用的空间扩大一倍建立另外一个哈希表；若是执行的是收缩操做：每次收缩根据已使用空间缩小一倍建立一个新的哈希表
- 3.2. 从新计算索引值（哈希算法），将键值对应到新的哈希表位置上
- 3.3. 全部键值迁移完成以后，释放旧哈希表的空间。
触发扩容的条件：
- 4.1. Redis服务目前没有执行BGSAVE命令或者BGREWRITEAOF命令，而且负载因子>=1
- 4.2. Redis服务目前正在执行 BGSAVE命令或者BGREWRITEAOF命令，而且负载因子>=5
- 4.3. 负载因子= 哈希表已保存节点数量 / 哈希表大小
渐进式rehash: 初始化扩容/收缩以后，查询在新旧两个哈希表查询，新增存放在新的哈希表，在迁移完成以后删除旧哈希表

4.跳跃表SkipList

跳跃表（skiplist）是一种有序数据结构，它经过在每一个节点中维持多个指向其它节点的指针，从而达到快速访问节点的目的。

结构定义

//表节点定义
typedef struct zskiplistNode {
     //层
     struct zskiplistLevel{
           //前进指针
           struct zskiplistNode *forward;
           //跨度
           unsigned int span;
     }level[];
 
     //后退指针
     struct zskiplistNode *backward;
     //分值
     double score;
     //成员对象
     robj *obj;
 
} zskiplistNode
复制代码

多个跳跃表节点构成了一个跳跃表

typedef struct zskiplist{
     //表头节点和表尾节点
     structz skiplistNode *header, *tail;
     //表中节点的数量
     unsigned long length;
     //表中层数最大的节点的层数
     int level;
 
}zskiplist;
复制代码

跳跃表特性：

由不少层结构组成；
每一层都是一个有序的链表，排列顺序为由高层到底层，都至少包含两个链表节点，分别是前面的head节点和后面的nil节点；
最底层的链表包含了全部的元素；
若是一个元素出如今某一层的链表中，那么在该层之下的链表也全都会出现（上一层的元素是当前层的元素的子集）；
链表中的每一个节点都包含两个指针，一个指向同一层的下一个链表节点，另外一个指向下一层的同一个链表节点；

操做
①、搜索：从最高层的链表节点开始，若是比当前节点要大和比当前层的下一个节点要小，那么则往下找，也就是和当前层的下一层的节点的下一个节点进行比较，以此类推，一直找到最底层的最后一个节点，若是找到则返回，反之则返回空。
②、插入：首先肯定插入的层数，有一种方法是假设抛一枚硬币，若是是正面就累加，直到碰见反面为止，最后记录正面的次数做为插入的层数。当肯定插入的层数k后，则须要将新元素插入到从底层到k层。
③、删除：在各个层中找到包含指定值的节点，而后将节点从链表中删除便可，若是删除之后只剩下头尾两个节点，则删除这一层。

5.压缩表ZipList

压缩列表（ziplist）是Redis为了节省内存而开发的，是由一系列特殊编码的连续内存块组成的顺序型数据结构，一个压缩列表能够包含任意多个节点（entry），每一个节点能够保存一个字节数组或者一个整数值。
压缩列表的原理：压缩列表并非对数据利用某种算法进行压缩，而是将数据按照必定规则编码在一块连续的内存区域，目的是节省内存。
结构定义

//列表节点
typedef struct ziplistNode{

  // 记录压缩列表前一个字节的长度.
  int previous_entry_length;
  // 节点的content的内容类型以及长度.encoding类型一共有两种，一种字节数组一种是整数，encoding区域长度为1字节、2字节或者5字节长。
  buf encoding;
  // 节点的内容,节点内容类型和长度由encoding决定。
  buf content;

}

// 压缩表
typedef struct ziplist{
     //表头节点和表尾节点
     structz ziplistNode entryX;
     //表中节点的数量
     unsigned long length;
     //表中层数最大的节点的层数
     int zlbytes;
     int zltail;
     int zlen;
     int zlend:

}ziplist;
复制代码

结构图

压缩表特性
- 节点数据 ①、previous_entry_ength：记录压缩列表前一个字节的长度。previous_entry_ength的长度多是1个字节或者是5个字节，若是上一个节点的长度小于254，则该节点只须要一个字节就能够表示前一个节点的长度了，若是前一个节点的长度大于等于254，则previous length的第一个字节为254，后面用四个字节表示当前节点前一个节点的长度。利用此原理即当前节点位置减去上一个节点的长度即获得上一个节点的起始位置，压缩列表能够从尾部向头部遍历。这么作颇有效地减小了内存的浪费。 ②、encoding：节点的encoding保存的是节点的content的内容类型以及长度，encoding类型一共有两种，一种字节数组一种是整数，encoding区域长度为1字节、2字节或者5字节长。 ③、content：content区域用于保存节点的内容，节点内容类型和长度由encoding决定。

当有序集合对象同时知足如下两个条件时，对象使用 ziplist 编码：
- 1.保存的元素数量小于128；
- 2.保存的全部元素长度都小于64字节。
- 不能知足上面两个条件的使用 skiplist 编码。以上两个条件也能够经过Redis配置文件zset-max-ziplist-entries 选项和 zset-max-ziplist-value 进行修改。

6.整数集合intset

整数集合intset是Redis用于保存整数值的集合抽象数据类型，他能够保存类型为int16_t,int32_t或者int64_t的整数值，而且保证集合中不会出现重复元素。

结构定义

typedef struct intset{
     //编码方式
     uint32_t encoding;
     //集合包含的元素数量
     uint32_t length;
     //保存元素的数组
     int8_t contents[];
 
}intset;
复制代码

整数集合的每个元素都是contents数组的一个数据项，他们按照从大到小的顺序排列，而且不包含任何重复项 length属性记录来contents数组的大小须要注意的是虽然contents数组声明为int_8类型，可是实际上contents数组并不保存任何int_8类型的值，其真正类型由encoding来决定。

升级当咱们新增的元素类型比原集合类型的长度要大时，须要对数组集合进行升级，才能将新元素放入整数集合中，具体步骤：

根据新元素的类型，扩展整数集合底层数组的大小/类型，并为新元素分配空间
若是扩展了类型，将底层数组如今的元素都转换为新元素的类型，并在转换后放到对应的位置，放置过程当中，维持整个数组元素都是有序的。‘
将新元素添加到整数集合中

降级整数集合不支持降级操做，一旦对数组进行来升级，编码就会一直保持升级后的状态。

Redis:底层数据结构分析

1.SDS(simple dynamic string)简单动态字符串

结构定义

优点

2.链表

链表的定义

链表特性

3.字典

哈希表结构定义

字典特性

4.跳跃表SkipList

结构定义

跳跃表特性：

操做

5.压缩表ZipList

结构定义

压缩表特性

6.整数集合intset

结构定义

操做

5.压缩表ZipList