Redisbook学习笔记(3)数据类型之列表

REDIS_LIST (列表) 是LPUSH 、LRANGE 等命令的操做对象, 它使用node

REDIS_ENCODING_ZIPLIST 和REDIS_ENCODING_LINKEDLIST 这两种方式编码:redis

wKioL1MITs2QL2gQAACErY08a4I028.jpg


编码的选择数据库

建立新列表时Redis 默认使用REDIS_ENCODING_ZIPLIST 编码,当如下任意一个条件被知足服务器

时,列表会被转换成REDIS_ENCODING_LINKEDLIST 编码:网络

试图往列表新添加一个字符串值, 且这个字符串的长度超过数据结构

server.list_max_ziplist_value (默认值为64 )。ide

ziplist 包含的节点超过server.list_max_ziplist_entries (默认值为512 )。函数

列表命令的实现编码

由于两种底层实现的抽象方式和列表的抽象方式很是接近,因此列表命令几乎就是经过一对一spa

地映射到底层数据结构的操做来实现的。

咱们将焦点放在BLPOP 、BRPOP 和BRPOPLPUSH 这个几个阻塞命令的实现原理上。

阻塞的条件

BLPOP 、BRPOP 和BRPOPLPUSH 三个命令均可能形成客户端被阻塞,如下将这些命令统

称为列表的阻塞原语。

阻塞原语并非必定会形成客户端阻塞:

只有当这些命令被用于空列表时,它们才会阻塞客户端。

若是被处理的列表不为空的话,它们就执行无阻塞版本的LPOP 、RPOP 或RPOPLPUSH

命令。

做为例子,如下流程图展现了BLPOP 决定是否对客户端进行阻塞过程:

wKioL1MITxuS-8G0AADG24Rbqgo857.jpg

阻塞

当一个阻塞原语的处理目标为空键时,执行该阻塞原语的客户端就会被阻塞。

阻塞一个客户端须要执行如下步骤:

1. 将客户端的状态设为“正在阻塞” ,并记录阻塞这个客户端的各个键,以及阻塞的最长时限

(timeout)等数据。

2. 将客户端的信息记录到server.db[i]->blocking_keys 中(其中i 为客户端所使用的数

据库号码)。

3. 继续维持客户端和服务器之间的网络链接,但再也不向客户端传送任何信息,形成客户端

阻塞。

步骤2 是未来解除阻塞的关键,server.db[i]->blocking_keys 是一个字典,字典的键是那

些形成客户端阻塞的键,而字典的值是一个链表,链表里保存了全部由于这个键而被阻塞的客

户端(被同一个键所阻塞的客户端可能不止一个):

wKiom1MIT2aySd1_AAClIHH4ifM237.jpg

在上图展现的blocking_keys 例子中,client2 、client5 和client1 三个客户端就正被

key1 阻塞,而其余几个客户端也正在被别的两个key 阻塞。

当客户端被阻塞以后,脱离阻塞状态有如下三种方法:

1. 被动脱离:有其余客户端为形成阻塞的键推入了新元素。

2. 主动脱离:到达执行阻塞原语时设定的最大阻塞时间。

3. 强制脱离:客户端强制终止和服务器的链接,或者服务器停机。

如下内容将分别介绍被动脱离和主动脱离的实现方式。

阻塞因LPUSH 、RPUSH 、LINSERT 等添加命令而被取消

经过将新元素推入形成客户端阻塞的某个键中,可让相应的客户端从阻塞状态中脱离出来

(取消阻塞的客户端数量取决于推入元素的数量)。

LPUSH 、RPUSH 和LINSERT 这三个添加新元素到列表的命令, 在底层都由一个

pushGenericCommand 的函数实现,这个函数的运做流程以下图:

wKioL1MIT5agg5ZJAAFkgli-0eE983.jpg

当向一个空键推入新元素时,pushGenericCommand 函数执行如下两件事:

1. 检查这个键是否存在于前面提到的server.db[i]->blocking_keys 字典里,若是是的

话,那么说明有至少一个客户端由于这个key 而被阻塞,程序会为这个键建立一个

redis.h/readyList 结构,并将它添加到server.ready_keys 链表中。

2. 将给定的值添加到列表键中。

readyList 结构的定义以下:

typedef struct readyList {
redisDb *db;
robj *key;
} readyList;

readyList 结构的key 属性指向形成阻塞的键,而db 则指向该键所在的数据库。

举个例子,假设某个非阻塞客户端正在使用0 号数据库,而这个数据库当前的blocking_keys

属性的值以下:

wKioL1MIT_Hwx0q9AACa453oTDI826.jpg

若是这时客户端对该数据库执行PUSH key3 value ,那么pushGenericCommand 将建立一个

db 属性指向0 号数据库、key 属性指向key3 键对象的readyList 结构,并将它添加到服务器

server.ready_keys 属性的链表中:

wKiom1MIUDTRmqrEAACEjWBbm8A032.jpg

在咱们这个例子中,到目前为止,pushGenericCommand 函数完成了如下两件事:

1. 将readyList 添加到服务器。

2. 将新元素value 添加到键key3 。

虽然key3 已经再也不是空键,但到目前为止,被key3 阻塞的客户端尚未任何一个被解除阻塞

状态。

为了作到这一点,Redis 的主进程在执行完pushGenericCommand 函数以后,会继续调用

handleClientsBlockedOnLists 函数,这个函数执行如下操做:

1. 若是server.ready_keys 不为空, 那么弹出该链表的表头元素, 并取出元素中的

readyList 值。

2. 根据readyList 值所保存的key 和db ,在server.blocking_keys 中查找全部由于key

而被阻塞的客户端(以链表的形式保存)。

3. 若是key 不为空,那么从key 中弹出一个元素,并弹出客户端链表的第一个客户端,然

后将被弹出元素返回给被弹出客户端做为阻塞原语的返回值。

4. 根据readyList 结构的属性,删除server.blocking_keys 中相应的客户端数据,取消

客户端的阻塞状态。

5. 继续执行步骤3 和4 ,直到key 没有元素可弹出,或者全部由于key 而阻塞的客户端都

取消阻塞为止。

6. 继续执行步骤1 ,直到ready_keys 链表里的全部readyList 结构都被处理完为止。

用一段伪代码描述以上操做可能会更直观一些:

def handleClientsBlockedOnLists():
# 执行直到ready_keys 为空
while server.ready_keys != NULL:
# 弹出链表中的第一个readyList
rl = server.ready_keys.pop_first_node()
# 遍历全部由于这个键而被阻塞的客户端
for client in all_client_blocking_by_key(rl.key, rl.db):
# 只要还有客户端被这个键阻塞,就一直从键中弹出元素
# 若是被阻塞客户端执行的是BLPOP ,那么对键执行LPOP
# 若是执行的是BRPOP ,那么对键执行RPOP
element = rl.key.pop_element()
if element == NULL:
# 键为空,跳出for 循环
# 余下的未解除阻塞的客户端只能等待下次新元素的进入了
break
else:#
清除客户端的阻塞信息
server.blocking_keys.remove_blocking_info(client)
# 将元素返回给客户端,脱离阻塞状态
client.reply_list_item(element)

先阻塞先服务(FBFS)策略

值得一提的是,当程序添加一个新的被阻塞客户端到server.blocking_keys 字典的链表中

时,它将该客户端放在链表的最后,而当handleClientsBlockedOnLists 取消客户端的阻塞

时,它从链表的最前面开始取消阻塞:这个链表造成了一个FIFO 队列,最早被阻塞的客户端

总值最早脱离阻塞状态,Redis 文档称这种模式为先阻塞先服务(FBFS,first-block-first-serve)。

举个例子,在下图所示的阻塞情况中,若是客户端对数据库执行PUSH key3 value ,那么只有

client3 会被取消阻塞,client6 和client4 仍然阻塞;若是客户端对数据库执行PUSH key3

value1 value2 ,那么client3 和client4 的阻塞都会被取消,而客户端client6 依然处于

阻塞状态:

wKioL1MIUM_QyeHRAACpMpSE3CI368.jpg

阻塞因超过最大等待时间而被取消

前面提到过,当客户端被阻塞时,全部形成它阻塞的键,以及阻塞的最长时限会被记录在客户

端里面,而且该客户端的状态会被设置为“正在阻塞” 。

每次Redis 服务器常规操做函数(server cron job)执行时,程序都会检查全部链接到服务器

的客户端,查看那些处于“正在阻塞”状态的客户端的最大阻塞时限是否已通过期,若是是的话,

就给客户端返回一个空白回复,而后撤销对客户端的阻塞。

能够用一段伪代码来描述这个过程:

def server_cron_job():
# 其余操做...
# 遍历全部已链接客户端
for client in server.all_connected_client:
# 若是客户端状态为“正在阻塞”,而且最大阻塞时限已到达
if client.state == BLOCKING and \
client.max_blocking_timestamp < current_timestamp():
# 那么给客户端发送空回复, 脱离阻塞状态
client.send_empty_reply()
# 并清除客户端在服务器上的阻塞信息
server.blocking_keys.remove_blocking_info(client)
# 其余操做...
相关文章
相关标签/搜索