五类对象就是咱们经常使用的string、list、set、zset、hashjava
咱们平时主要是经过操做对象的api来操做redis,而不是经过它的调用它底层数据结构来完成(外观模式)。但咱们还须要了解其底层,只有这样才能写最优化高效的代码。git
typedef struct redisObject {
// 类型
unsigned type:4;
// 编码
unsigned encoding:4;
// 指向底层实现数据结构的指针
void *ptr;
// ...
} robj;
复制代码
记录对象类型。github
咱们平时用的命令type <key>
,其实就是返回这个字段的属性。redis
127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> type hello
string
127.0.0.1:6379> rpush list 1 2 3
(integer) 3
127.0.0.1:6379> type list
list
...
复制代码
那type有多少中类型呢?看下面这个表:算法
对象 | type 字段 | TYPE命令的输出 |
---|---|---|
字符串对象 | REDIS_STRING | "string" |
列表对象 | REDIS_LIST | |
哈希对象 | REDIS_HASH | |
集合对象 | REDIS_SET | |
有序集合对象 | REDIS_ZSET |
记录对象使用的编码(数据结构),Reids中称数据结构为encoding。api
咱们能够这样查看咱们redis对象中的encoding:bash
127.0.0.1:6379> object encoding hello
"embstr"
127.0.0.1:6379> object encoding list
"quicklist"
...
复制代码
既然它是标明该redisObject
是使用的什么数据结构,那确定也有个对应的表:数据结构
类型 | 编码 | 对象 |
---|---|---|
REDIS_STRING | REDIS_ENCODING_INT | 使用整数值实现的字符串对象。 |
REDIS_STRING | REDIS_ENCODING_EMBSTR | 使用 embstr 编码的简单动态字符串实现的字符串对象。 |
REDIS_STRING | REDIS_ENCODING_RAW | 使用简单动态字符串实现的字符串对象。 |
REDIS_LIST | REDIS_ENCODING_ZIPLIST | 使用压缩列表实现的列表对象。 |
REDIS_LIST | REDIS_ENCODING_LINKEDLIST | 使用双端链表实现的列表对象。 |
REDIS_HASH | REDIS_ENCODING_ZIPLIST | 使用压缩列表实现的哈希对象。 |
REDIS_HASH | REDIS_ENCODING_HT | 使用字典实现的哈希对象。 |
REDIS_SET | REDIS_ENCODING_INTSET | 使用整数集合实现的集合对象。 |
REDIS_SET | REDIS_ENCODING_HT | 使用字典实现的集合对象。 |
REDIS_ZSET | REDIS_ENCODING_ZIPLIST | 使用压缩列表实现的有序集合对象。 |
REDIS_ZSET | REDIS_ENCODING_SKIPLIST | 使用跳跃表和字典实现的有序集合对象。 |
咱们能够看到,Redis对对象的底层encoding分的很细,String类型就有三个,其它四个对象都分别有两种不一样的底层数据结构的实现。他们有一规律,就是用ziplist
、intset
、embstr
来实现少许的数据,数据量一旦庞大,就会升级到skiplist
、raw
、linkedlist
、ht
来实现,后面我会仔细讲解。app
字符串编码有三个:int、raw、embstr。jvm
当string对象的值所有是数字,就会使用int编码。
127.0.0.1:6379> set number 123455
OK
127.0.0.1:6379> object encoding number
"int"
复制代码
字符串或浮点数长度小于等于39字节,就会使用embstr编码方式来存储,embstr存储内存通常很小,因此redis一次性分配且内存连续(效率高)。
127.0.0.1:6379> set shortStr "suwe suwe suwe"
OK
127.0.0.1:6379> object encoding shortStr
"embstr"
复制代码
当一个字符串或浮点数长度大于39字节,就使用SDS来保存,编码为raw,因为不肯定值的字节大小,因此键和值各分配各的,因此就分配两次内存(回收也是两次),同理它必定不是内存连续的。
127.0.0.1:6379> set longStr "hello everyone, we dont need to sleep around to go aheard! do you think?"
OK
127.0.0.1:6379> object encoding longStr
"raw"
复制代码
前面说过,Redis会自动对编码进行转换来适应和优化数据的存储。
int->raw
条件:数字对象进行append字母,就会发生转换。
127.0.0.1:6379> object encoding number
"int"
127.0.0.1:6379> append number " is a lucky number"
(integer) 24
127.0.0.1:6379> object encoding number
"raw"
复制代码
embstr->raw
条件:对embstr进行修改,redis会先将其转换成raw,而后才进行修改。因此embstr其实是只读性质的。
127.0.0.1:6379> object encoding shortStr
"embstr"
127.0.0.1:6379> append shortStr "(hhh"
(integer) 18
127.0.0.1:6379> object encoding shortStr
"raw"
复制代码
列表对象编码能够是:ziplist或linkedlist。
ziplist
压缩列表不知道你们还记得不,就是zlbytes zltail zllen entry1 entry2 ..end
结构,entry节点
里有pre-length、encoding、content
属性,忘记的能够返回去看下。
linkedlist
,相似双向链表,也是上一章的知识。
ziplist->linkedlist
条件:列表对象的全部字符串元素的长度大于等于64字节 & 列表元素数大于等于512. 反之,小于64和小于512会使用ziplist而不是用linkedlist。
这个阈值是能够修改的,修改选项:
list-max-ziplist-value
和list-max-ziplist-entriess
哈希对象的编码有:ziplist和hashtable
ziplist->hashtable
条件:哈希对象全部键和值字符串长度大于等于64字节 & 键值对数量大于等于512
这个阈值也是能够修改的,修改选项:
hash-max-ziplist-value
和hash-max-ziplist-entriess
集合对象的编码有:intset和hashtable
intset->hashtable
条件:元素不都是整数 & 元素数大于等于512
有序集合用到的编码:ziplist和skiplist
你们可能很好奇阿,ziplist的entry中只有属性content能够存放数据,集合也是key-value
形式,那怎么存储呢?
第一个节点保存key、第二个节点保存value 以此类推...
ziplist->skiplist
条件:有序集合元素数 >= 128 & 含有元素的长度 >= 64
这个阈值也是能够修改的,修改选项:
zset-max-ziplist-value
和zset-max-ziplist-entriess
为何要说内存回收呢,由于redisObject有一个字段:
typedef struct redisObject {
// ...
// 引用计数
int refcount;
// ...
} robj;
复制代码
redis的垃圾回收采用引用计数法(和jvm同样),底层采用一个变量对对象的使用行为进行计数。
节约内存
成本过高。
验证整数相等只须要O(1)的时间复杂度,而验证字符串要O(n).
最后,redisObject还有一个字段,记录了对象最后一次被访问的时间:
typedef struct redisObject {
// ...
unsigned lru:22;
// ...
} robj;
复制代码
由于这个字段记录对象最后一次被访问的时间,因此它能够用来查看该对象多久未使用,即:用当前时间-lru
127.0.0.1:6379> object idletime hello
(integer) 5110
复制代码
它还关系到redis的热点数据实现,若是咱们选择lr算法,当内存超出阈值后会对空闲时长较高的对象进行释放,回收内存。
关注个人公众号,随时阅读个人所有文章。
想看往期文章, 请点击个人GitHub地址: github.com/fantj2016/j…