通俗易懂的Redis数据结构基础教程

Redis有5个基本数据结构,string、list、hash、set和zset。它们是平常开发中使用频率很是高应用最为普遍的数据结构,把这5个数据结构都吃透了,你就掌握了Redis应用知识的一半了。javascript

string

首先咱们从string谈起。string表示的是一个可变的字节数组,咱们初始化字符串的内容、能够拿到字符串的长度,能够获取string的子串,能够覆盖string的子串内容,能够追加子串。java

Redis的字符串是动态字符串,是能够修改的字符串,内部结构实现上相似于Java的ArrayList,采用预分配冗余空间的方式来减小内存的频繁分配,如图中所示,内部为当前字符串实际分配的空间capacity通常要高于实际字符串长度len。当字符串长度小于1M时,扩容都是加倍现有的空间,若是超过1M,扩容时一次只会多扩1M的空间。须要注意的是字符串最大长度为512M。python

初始化字符串 须要提供「变量名称」和「变量的内容」程序员

> set ireader beijing.zhangyue.keji.gufen.youxian.gongsi
OK
复制代码

获取字符串的内容 提供「变量名称」数组

> get ireader
"beijing.zhangyue.keji.gufen.youxian.gongsi"
复制代码

获取字符串的长度 提供「变量名称」ruby

> strlen ireader
(integer) 42
复制代码

获取子串 提供「变量名称」以及开始和结束位置[start, end]bash

> getrange ireader 28 34
"youxian"
复制代码

覆盖子串 提供「变量名称」以及开始位置和目标子串微信

> setrange ireader 28 wooxian
(integer) 42  # 返回长度
> get ireader
"beijing.zhangyue.keji.gufen.wooxian.gongsi"
复制代码

追加子串markdown

> append ireader .hao
(integer) 46 # 返回长度
> get ireader
"beijing.zhangyue.keji.gufen.wooxian.gongsi.hao"
复制代码

遗憾的是字符串没有提供字串插入方法和子串删除方法。数据结构

计数器 若是字符串的内容是一个整数,那么还能够将字符串当成计数器来使用。

> set ireader 42
OK
> get ireader
"42"
> incrby ireader 100
(integer) 142
> get ireader
"142"
> decrby ireader 100
(integer) 42
> get ireader
"42"
> incr ireader  # 等价于incrby ireader 1
(integer) 43
> decr ireader  # 等价于decrby ireader 1
(integer) 42
复制代码

计数器是有范围的,它不能超过Long.Max,不能低于Long.MIN

> set ireader 9223372036854775807
OK
> incr ireader
(error) ERR increment or decrement would overflow
> set ireader -9223372036854775808
OK
> decr ireader
(error) ERR increment or decrement would overflow
复制代码

过时和删除 字符串可使用del指令进行主动删除,可使用expire指令设置过时时间,到点会自动删除,这属于被动删除。可使用ttl指令获取字符串的寿命。

> expire ireader 60
(integer) 1  # 1表示设置成功,0表示变量ireader不存在
> ttl ireader
(integer) 50  # 还有50秒的寿命,返回-2表示变量不存在,-1表示没有设置过时时间
> del ireader
(integer) 1  # 删除成功返回1
> get ireader
(nil)  # 变量ireader没有了
复制代码

list

Redis将列表数据结构命名为list而不是array,是由于列表的存储结构用的是链表而不是数组,并且链表仍是双向链表。由于它是链表,因此随机定位性能较弱,首尾插入删除性能较优。若是list的列表长度很长,使用时咱们必定要关注链表相关操做的时间复杂度。

负下标 链表元素的位置使用天然数0,1,2,....n-1表示,还可使用负数-1,-2,...-n来表示,-1表示「倒数第一」,-2表示「倒数第二」,那么-n就表示第一个元素,对应的下标为0

队列/堆栈 链表能够从表头和表尾追加和移除元素,结合使用rpush/rpop/lpush/lpop四条指令,能够将链表做为队列或堆栈使用,左向右向进行均可以

# 右进左出
> rpush ireader go
(integer) 1
> rpush ireader java python
(integer) 3
> lpop ireader
"go"
> lpop ireader
"java"
> lpop ireader
"python"
# 左进右出
> lpush ireader go java python
(integer) 3
> rpop ireader
"go"
...
# 右进右出
> rpush ireader go java python
(integer) 3
> rpop ireader 
"python"
...
# 左进左出
> lpush ireader go java python
(integer) 3
> lpop ireader
"python"
...
复制代码

在平常应用中,列表经常使用来做为异步队列来使用。

长度 使用llen指令获取链表长度

> rpush ireader go java python
(integer) 3
> llen ireader
(integer) 3
复制代码

随机读 可使用lindex指令访问指定位置的元素,使用lrange指令来获取链表子元素列表,提供start和end下标参数

> rpush ireader go java python
(integer) 3
> lindex ireader 1
"java"
> lrange ireader 0 2
1) "go"
2) "java"
3) "python"
> lrange ireader 0 -1  # -1表示倒数第一
1) "go"
2) "java"
3) "python"
复制代码

使用lrange获取所有元素时,须要提供end_index,若是没有负下标,就须要首先经过llen指令获取长度,才能够得出end_index的值,有了负下标,使用-1代替end_index就能够达到相同的效果。

修改元素 使用lset指令在指定位置修改元素。

> rpush ireader go java python
(integer) 3
> lset ireader 1 javascript
OK
> lrange ireader 0 -1
1) "go"
2) "javascript"
3) "python"
复制代码

插入元素 使用linsert指令在列表的中间位置插入元素,有经验的程序员都知道在插入元素时,咱们常常搞不清楚是在指定位置的前面插入仍是后面插入,因此antirez在linsert指令里增长了方向参数before/after来显示指示前置和后置插入。不过让人意想不到的是linsert指令并非经过指定位置来插入,而是经过指定具体的值。这是由于在分布式环境下,列表的元素老是频繁变更的,意味着上一时刻计算的元素下标在下一时刻可能就不是你所指望的下标了。

> rpush ireader go java python
(integer) 3
> linsert ireader before java ruby
(integer) 4
> lrange ireader 0 -1
1) "go"
2) "ruby"
3) "java"
4) "python"
复制代码

到目前位置,我尚未在实际应用中发现插入指定的应用场景。

删除元素 列表的删除操做也不是经过指定下标来肯定元素的,你须要指定删除的最大个数以及元素的值

> rpush ireader go java python
(integer) 3
> lrem ireader 1 java
(integer) 1
> lrange ireader 0 -1
1) "go"
2) "python"
复制代码

定长列表 在实际应用场景中,咱们有时候会遇到「定长列表」的需求。好比要以走马灯的形式实时显示中奖用户名列表,由于中奖用户实在太多,能显示的数量通常不超过100条,那么这里就会使用到定长列表。维持定长列表的指令是ltrim,须要提供两个参数start和end,表示须要保留列表的下标范围,范围以外的全部元素都将被移除。

> rpush ireader go java python javascript ruby erlang rust cpp
(integer) 8
> ltrim ireader -3 -1
OK
> lrange ireader 0 -1
1) "erlang"
2) "rust"
3) "cpp"
复制代码

若是指定参数的end对应的真实下标小于start,其效果等价于del指令,由于这样的参数表示须要须要保留列表元素的下标范围为空。

快速列表

若是再深刻一点,你会发现Redis底层存储的还不是一个简单的linkedlist,而是称之为快速链表quicklist的一个结构。首先在列表元素较少的状况下会使用一块连续的内存存储,这个结构是ziplist,也便是压缩列表。它将全部的元素紧挨着一块儿存储,分配的是一块连续的内存。当数据量比较多的时候才会改为quicklist。由于普通的链表须要的附加指针空间太大,会比较浪费空间。好比这个列表里存的只是int类型的数据,结构上还须要两个额外的指针prev和next。因此Redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样既知足了快速的插入删除性能,又不会出现太大的空间冗余。

hash

哈希等价于Java语言的HashMap或者是Python语言的dict,在实现结构上它使用二维结构,第一维是数组,第二维是链表,hash的内容key和value存放在链表中,数组里存放的是链表的头指针。经过key查找元素时,先计算key的hashcode,而后用hashcode对数组的长度进行取模定位到链表的表头,再对链表进行遍历获取到相应的value值,链表的做用就是用来将产生了「hash碰撞」的元素串起来。Java语言开发者会感到很是熟悉,由于这样的结构和HashMap是没有区别的。哈希的第一维数组的长度也是2^n。

增长元素 可使用hset一次增长一个键值对,也可使用hmset一次增长多个键值对

> hset ireader go fast
(integer) 1
> hmset ireader java fast python slow
OK
复制代码

获取元素 能够经过hget定位具体key对应的value,能够经过hmget获取多个key对应的value,可使用hgetall获取全部的键值对,可使用hkeys和hvals分别获取全部的key列表和value列表。这些操做和Java语言的Map接口是相似的。

> hmset ireader go fast java fast python slow
OK
> hget ireader go
"fast"
> hmget ireader go python
1) "fast"
2) "slow"
> hgetall ireader
1) "go"
2) "fast"
3) "java"
4) "fast"
5) "python"
6) "slow"
> hkeys ireader
1) "go"
2) "java"
3) "python"
> hvals ireader
1) "fast"
2) "fast"
3) "slow"
复制代码

删除元素 可使用hdel删除指定key,hdel支持同时删除多个key

> hmset ireader go fast java fast python slow
OK
> hdel ireader go
(integer) 1
> hdel ireader java python
(integer) 2
复制代码

判断元素是否存在 一般咱们使用hget得到key对应的value是否为空就直到对应的元素是否存在了,不过若是value的字符串长度特别大,经过这种方式来判断元素存在与否就略显浪费,这时可使用hexists指令。

> hmset ireader go fast java fast python slow
OK
> hexists ireader go
(integer) 1
复制代码

计数器 hash结构还能够当成计数器来使用,对于内部的每个key均可以做为独立的计数器。若是value值不是整数,调用hincrby指令会出错。

> hincrby ireader go 1
(integer) 1
> hincrby ireader python 4
(integer) 4
> hincrby ireader java 4
(integer) 4
> hgetall ireader
1) "go"
2) "1"
3) "python"
4) "4"
5) "java"
6) "4"
> hset ireader rust good
(integer) 1
> hincrby ireader rust 1
(error) ERR hash value is not an integer
复制代码

扩容 当hash内部的元素比较拥挤时(hash碰撞比较频繁),就须要进行扩容。扩容须要申请新的两倍大小的数组,而后将全部的键值对从新分配到新的数组下标对应的链表中(rehash)。若是hash结构很大,好比有上百万个键值对,那么一次完整rehash的过程就会耗时很长。这对于单线程的Redis里来讲有点压力山大。因此Redis采用了渐进式rehash的方案。它会同时保留两个新旧hash结构,在后续的定时任务以及hash结构的读写指令中将旧结构的元素逐渐迁移到新的结构中。这样就能够避免因扩容致使的线程卡顿现象。

缩容 Redis的hash结构不但有扩容还有缩容,从这一点出发,它要比Java的HashMap要厉害一些,Java的HashMap只有扩容。缩容的原理和扩容是一致的,只不过新的数组大小要比旧数组小一倍。

set

Java程序员都知道HashSet的内部实现使用的是HashMap,只不过全部的value都指向同一个对象。Redis的set结构也是同样,它的内部也使用hash结构,全部的value都指向同一个内部值。

增长元素 能够一次增长多个元素

> sadd ireader go java python
(integer) 3
复制代码

读取元素 使用smembers列出全部元素,使用scard获取集合长度,使用srandmember获取随机count个元素,若是不提供count参数,默认为1

> sadd ireader go java python
(integer) 3
> smembers ireader
1) "java"
2) "python"
3) "go"
> scard ireader
(integer) 3
> srandmember ireader
"java"
复制代码

删除元素 使用srem删除一到多个元素,使用spop删除随机一个元素

> sadd ireader go java python rust erlang
(integer) 5
> srem ireader go java
(integer) 2
> spop ireader
"erlang"
复制代码

判断元素是否存在 使用sismember指令,只能接收单个元素

> sadd ireader go java python rust erlang
(integer) 5
> sismember ireader rust
(integer) 1
> sismember ireader javascript
(integer) 0
复制代码

sortedset

SortedSet(zset)是Redis提供的一个很是特别的数据结构,一方面它等价于Java的数据结构Map<String, Double>,能够给每个元素value赋予一个权重score,另外一方面它又相似于TreeSet,内部的元素会按照权重score进行排序,能够获得每一个元素的名次,还能够经过score的范围来获取元素的列表。

zset底层实现使用了两个数据结构,第一个是hash,第二个是跳跃列表,hash的做用就是关联元素value和权重score,保障元素value的惟一性,能够经过元素value找到相应的score值。跳跃列表的目的在于给元素value排序,根据score的范围获取元素列表。

增长元素 经过zadd指令能够增长一到多个value/score对,score放在前面

> zadd ireader 4.0 python
(integer) 1
> zadd ireader 4.0 java 1.0 go
(integer) 2
复制代码

长度 经过指令zcard能够获得zset的元素个数

> zcard ireader
(integer) 3
复制代码

删除元素 经过指令zrem能够删除zset中的元素,能够一次删除多个

> zrem ireader go python
(integer) 2
复制代码

计数器 同hash结构同样,zset也能够做为计数器使用。

> zadd ireader 4.0 python 4.0 java 1.0 go
(integer) 3
> zincrby ireader 1.0 python
"5"
复制代码

获取排名和分数 经过zscore指令获取指定元素的权重,经过zrank指令获取指定元素的正向排名,经过zrevrank指令获取指定元素的反向排名[倒数第一名]。正向是由小到大,负向是由大到小。

> zscore ireader python
"5"
> zrank ireader go  # 分数低的排名考前,rank值小
(integer) 0
> zrank ireader java
(integer) 1
> zrank ireader python
(integer) 2
> zrevrank ireader python
(integer) 0
复制代码

根据排名范围获取元素列表 经过zrange指令指定排名范围参数获取对应的元素列表,携带withscores参数能够一并获取元素的权重。经过zrevrange指令按负向排名获取元素列表[倒数]。正向是由小到大,负向是由大到小。

> zrange ireader 0 -1  # 获取全部元素
1) "go"
2) "java"
3) "python"
> zrange ireader 0 -1 withscores
1) "go"
2) "1"
3) "java"
4) "4"
5) "python"
6) "5"
> zrevrange ireader 0 -1 withscores
1) "python"
2) "5"
3) "java"
4) "4"
5) "go"
6) "1"
复制代码

根据score范围获取列表 经过zrangebyscore指令指定score范围获取对应的元素列表。经过zrevrangebyscore指令获取倒排元素列表。正向是由小到大,负向是由大到小。参数-inf表示负无穷,+inf表示正无穷。

> zrangebyscore ireader 0 5
1) "go"
2) "java"
3) "python"
> zrangebyscore ireader -inf +inf withscores
1) "go"
2) "1"
3) "java"
4) "4"
5) "python"
6) "5"
> zrevrangebyscore ireader +inf -inf withscores  # 注意正负反过来了
1) "python"
2) "5"
3) "java"
4) "4"
5) "go"
6) "1"
复制代码

根据范围移除元素列表 能够经过排名范围,也能够经过score范围来一次性移除多个元素

> zremrangebyrank ireader 0 1
(integer) 2  # 删掉了2个元素
> zadd ireader 4.0 java 1.0 go
(integer) 2
> zremrangebyscore ireader -inf 4
(integer) 2
> zrange ireader 0 -1
1) "python"
复制代码

跳跃列表 zset内部的排序功能是经过「跳跃列表」数据结构来实现的,它的结构很是特殊,也比较复杂。这一块的内容深度读者要有心理准备。

由于zset要支持随机的插入和删除,因此它很差使用数组来表示。咱们先看一个普通的链表结构。

咱们须要这个链表按照score值进行排序。这意味着当有新元素须要插入时,须要定位到特定位置的插入点,这样才能够继续保证链表是有序的。一般咱们会经过二分查找来找到插入点,可是二分查找的对象必须是数组,只有数组才能够支持快速位置定位,链表作不到,那该怎么办?

想一想一个创业公司,刚开始只有几我的,团队成员之间人人平等,都是联合创始人。随着公司的成长,人数渐渐变多,团队沟通成本随之增长。这时候就会引入组长制,对团队进行划分。每一个团队会有一个组长。开会的时候分团队进行,多个组长之间还会有本身的会议安排。公司规模进一步扩展,须要再增长一个层级——部门,每一个部门会从组长列表中推选出一个表明来做为部长。部长们之间还会有本身的高层会议安排。

跳跃列表就是相似于这种层级制,最下面一层全部的元素都会串起来。而后每隔几个元素挑选出一个表明来,再将这几个表明使用另一级指针串起来。而后在这些表明里再挑出二级表明,再串起来。最终就造成了金字塔结构。

想一想你老家在世界地图中的位置:亚洲-->中国->安徽省->安庆市->枞阳县->汤沟镇->田间村->xxxx号,也是这样一个相似的结构。

「跳跃列表」之因此「跳跃」,是由于内部的元素可能「身兼数职」,好比上图中间的这个元素,同时处于L0、L1和L2层,能够快速在不一样层次之间进行「跳跃」。

定位插入点时,先在顶层进行定位,而后下潜到下一级定位,一直下潜到最底层找到合适的位置,将新元素插进去。你也许会问那新插入的元素如何才有机会「身兼数职」呢?

跳跃列表采起一个随机策略来决定新元素能够兼职到第几层,首先L0层确定是100%了,L1层只有50%的几率,L2层只有25%的几率,L3层只有12.5%的几率,一直随机到最顶层L31层。绝大多数元素都过不了几层,只有极少数元素能够深刻到顶层。列表中的元素越多,可以深刻的层次就越深,能进入到顶层的几率就会越大。

这还挺公平的,能不能进入中央不是靠拼爹,而是看运气。

微信扫一扫关注公众号「码洞」,阅读更多精彩文章

相关文章
相关标签/搜索