Redis 源码学习之 Redis 事务

时间 2021-08-13

标签 redis 算法数据库编程数组服务器 async ide 函数 this 栏目 Redis 繁體版

原文原文链接

做者：天凉好个秋redis

Redis做为一个内存型数据库，一样支持传统数据库的事务特性。这篇文章会从源代码角度来分析Redis中事务的实现原理。算法

What数据库

Redis事务提供了一种将多个命令请求打包，而后一次性、按照顺序地执行多个命令的机制，而且在事务执行的期间，服务器不会中断事务而去执行其余不在事务中的命令请求，它会把事务中全部的命令都执行完毕才会去执行其余的命令。编程

How数组

Redis中提供了multi、discard、exec、watch、unwatch这几个命令来实现事务的功能。服务器

Redis的事务始于multi命令，以后跟着要在事务中执行的命令，终于exec命令或者discard命令。加入事务中的全部命令会原子的执行，中间不会穿插执行其余没有加入事务的命令。async

multi、exec和discardide

multi命令告诉Redis客户端要开始一个事物,而后Redis会返回一个OK，接下来全部的命令Redis都不会当即执行，只会返回QUEUED结果，直到遇到了exec命令才会去执行以前的全部的命令，或者遇到了discard命令，会抛弃执行以前加入事务的命令。函数

127.0.0.1:6379> get namethis

(nil)

127.0.0.1:6379> get gender

(nil)

127.0.0.1:6379> multi

OK

127.0.0.1:6379> set name Slogen

QUEUED

127.0.0.1:6379> set gender male

QUEUED

127.0.0.1:6379> exec

1) OK

2) OK

127.0.0.1:6379> mget name gender

1) "Slogen"

2) "male"

watch

watch命令是Redis提供的一个乐观锁，能够在exec执行以前，监视任意数量的数据库key，并在exec命令执行的时候，检测被监视的key是否至少有一个已经被修改，若是是的话，服务器将拒绝执行事务，并向客户端返回表明事务执行失败的空回复。

首先在client1执行下列命令:

127.0.0.1:6379> get name

(nil)

127.0.0.1:6379> watch name

OK

127.0.0.1:6379> multi

OK

127.0.0.1:6379> set name slogen

QUEUED

127.0.0.1:6379> set gender male

QUEUED

127.0.0.1:6379> get name

QUEUED

这个时候client尚未执行exec命令，接下来在client2下执行下面命令修改name:

127.0.0.1:6379> set name rio

OK

127.0.0.1:6379> get name

"rio"

接下来在client1下执行exec命令:

127.0.0.1:6379> exec

(nil)

127.0.0.1:6379> get name

"rio"

从执行结果能够看到，在client1中执行exec命令的时候，Redis会检测到name字段已经被其余客户端修改了，因此拒绝执行事务中全部的命令，直接返回nil表示执行失败。这个时候获取到的name的值仍是在client2中设置的rio。

Why

multi

Redis的事务始于multi命令，那么就从multi命令的源代码开始分析。

当Redis接收到客户端发送过来的命令以后会执行multiCommand()这个方法，这个方法在multi.c文件中。

void multiCommand(client *c) {

    // 1. 若是检测到flags里面已经包含了CLIENT_MULTI

    // 表示对应client已经处于事务的上下文中，返回错误

    if (c->flags & CLIENT_MULTI) {

        addReplyError(c,"MULTI calls can not be nested");

        return;

    }

    // 2. 开启flags的CLIENT_MULTI标识

    c->flags |= CLIENT_MULTI;

    // 3. 返回ok,告诉客户端已经成功开启事务

    addReply(c,shared.ok);

}

从源代码中能够看到，multiCommand()主要完成下面三件事:

检测发送multi命令的client是否已经处于事务中，若是是则直接返回错误。从这里能够看到，Redis不支持事务嵌套执行。
给对应client的flags标志位中增长MULTI_CLIENT标志，表示已经进入事务中。
返回OK告诉客户端已经成功开启事务。

从前面的文章中能够知道，Redis接收到全部的Client发送过来的命令后都会执行到processCommand()这个方法中，在processCommand()中有下面这部分代码:

在processCommand()执行实际的命令以前会先判断对应的client是否已经处于事务的上下文中，若是是的话，且须要执行的命令不是exec、discard、multi和watch这四个命令中的任何一个，则调用queueMultiCommand()方法把须要执行的命令加入队列中，不然的话调用call()直接执行命令。

queueMultiCommand()

Redis调用queueMultiCommand()方法把加入事务的命令加入Redis队列中，实现以下:

queueMultiCommand()方法主要是把要加入事务的命令封装在multiCmd结构的变量，而后放置到client->mstate.commands数组中去，multiCmd的定义以下:

typedef struct multiCmd {

    robj **argv; // 命令的参数数组

    int argc; // 命令的参数个数

    struct redisCommand *cmd; // 要执行的命令

} multiCmd;

而mstate字段定义为:

typedef struct client {

// 其余省略代码

multiState mstate; /* MULTI/EXEC state */

} client;

multiState的结构为:

typedef struct multiState {

    multiCmd *commands;     /* Array of MULTI commands */

    int count;              /* Total number of MULTI commands */

    int minreplicas;        /* MINREPLICAS for synchronous replication */

    time_t minreplicas_timeout; /* MINREPLICAS timeout as unixtime. */

} multiState;

commands:multiCmd类型的数组，存放着事务中全部的要执行的命令
count:当前事务中全部已经存放的命令的个数

另外两个字段当前版本中(3.2.28)没用上。

假设当前事务队列中已经存在set name slogen和lpush num 20这两个命令的时候，client中的mstate的数据以下:

这个时候再往事务中添加get name这个命令的时候结构图以下:

错误命令:CLIENT_DIRTY_EXEC

那么有个问题，好比我往事务中添加的命令是个不存在的命令，或者命令使用方式，好比命令参数不对，这个时候这个命令会被加入事务吗？

前面说了，Redis接收到的全部的命令都是执行到processCommand()这个方法，在实际执行对应的命令前，processCommand()方法都会对将要执行的命令进行一系列的检查，代码以下:

从上面代码能够看到，processCommand()在对要执行的命令进行的一系列检查的时候若是有任何一项检测失败都会调用flagTransaction()函数而后返回对应的信息给客户端，flagTransaction()实现以下:

void flagTransaction(client *c) {

    if (c->flags & CLIENT_MULTI)

        // 若是flags包含CLIENT_MULTI标志位，表示已经处于事务上下文中

        // 则给对应的client的flags开启CLIENT_DIRTY_EXEC标志位

        c->flags |= CLIENT_DIRTY_EXEC;

}

flagTransaction()方法会检测对应的client是否处于事务的上下文中，若是是的话就给对应的client的flags字段开启CLIENT_DIRTY_EXEC标志位。

也就是说，若是命令在加入事务的时候因为各类缘由，好比命令不存在，或者对应的命令参数不正确，则对应的命令不会被添加到mstate.commands数组中，且同时给对应的client的flags字段开启CLIENT_DIRTY_EXEC标志位。

watch命令

当client处于事务的上下文中时，watch命令属于能够被当即执行的几个命令之一,watch命令对应的代码为watchCommand()函数，实现以下:

void watchCommand(client *c) {

    int j;

    if (c->flags & CLIENT_MULTI) {

        // 若是执行watch命令的client处于事务的上下文中则直接返回

        addReplyError(c,"WATCH inside MULTI is not allowed");

        return;

    }

    for (j = 1; j < c->argc; j++)

        // 对传入的每一个要watch的能够调用watchForKey()

        watchForKey(c,c->argv[j]);

    addReply(c,shared.ok);

}

watchCommand()方法会首先判断执行watch的命令是否已经处于事务的上下文中，若是是的话则直接报错返回，说明在Redis事务中不能调用watch命令。

接下来对于watch命令传入的全部的key，依次调用watchForKey()方法，定义以下:

watchForKey()方法会作下面几件事:

判断对应的key是否已经存在于client->watched_keys列表中，若是已经存在则直接返回。client->watched_keys保存着对应的client对象全部的要监视的key。
若是不存在，则去client->db->watched_keys中查找全部的已经监视了这个key的client对象。client->db->watched_keys以dict的结构保存了全部的监视这个key的client列表。
若是第二步中的列表存在，则把执行watch命令的client添加到这个列表的尾部，若是不存在，表示尚未任何一个client监视这个key,则新建一个列表，添加到client->db->watched_keys中，而后把执行watch命令的client添加到新生成的列表的尾部。
把传入的key封装成一个watchedKey结构的变量，添加到client->watched_key列表的最后面。

假设当前client->db->watched_keys的监测状况以下图所示:

而client->watched_keys的监测状况以下:

这个时候client_A执行watch key1 key2 key3这个命令，执行完命令以后client->db->watched_keys结果为

而client->watched_keys结果为

对于key1,目前尚未client对key1进行监视，因此这个时候client_A会新建一个列表，把本身添加到这个列表中而后把映射关系添加到client->db->watched_keys中去，以后会把key1添加到client->watched_keys列表的最后。

对于key2，因为已经存在于watched_keys列表中，因此会直接返回不作任何处理。

对于key3，因为client->db->watched_keys中已经有client_B和client_C在监视它，因此会直接把client_A添加到监视列表的末尾以后再把key3添加到client_A的监视列表中去。

修改数据:CLIENT_DIRTY_CAS

watch命令的做用就是用在事务中检测被监视的key是否被其余的client修改了，若是已经被修改，则阻止事务的执行，那么这个功能是怎么实现的呢？

这里以set命令为例进行分析。

假设client_A执行了watch name这个命令而后执行multi命令开启了事务可是尚未执行exec命令，这个时候client_B执行了set name slogen这个命令,整个过程以下:

时间	client_A	client_B
T1	watch name
T2	multi
T3	get name
T4		set name slogen
T5	exec

在T4的时候client_B执行了set命令修改了name,Redis收到set命令以后会执行setCommand方法，实现以下:

void setCommand(client *c) {

// 其余省略代码

setGenericCommand(c,flags,c->argv[1],c->argv[2],expire,unit,NULL,NULL);

}

在setCommand()最后会调用setGenericCommand()方法，改方法实现以下:

void setGenericCommand(client *c, int flags, robj *key, robj *val, robj *expire, int unit, robj *ok_reply, robj *abort_reply) {

    // 其余省略代码

    setKey(c->db,key,val);

    // 其余省略代码

}

在setGenericCommand()方法中会调用setKey()这个方法，接着看下setKey()这个方法:

void setKey(redisDb *db, robj *key, robj *val) {

    if (lookupKeyWrite(db,key) == NULL) {

        dbAdd(db,key,val);

    } else {

        dbOverwrite(db,key,val);

    }

    incrRefCount(val);

    removeExpire(db,key);

    // 通知修改了key

    signalModifiedKey(db,key);

}

在setKey()方法最后会调用signaleModifiedKey()通知redis数据库中有数据被修改,signaleModifiedKey()方法实现以下:

void signalModifiedKey(redisDb *db, robj *key) {

touchWatchedKey(db,key);

}

能够看到signalModifiedKey()也仅仅是调用touchWatchedKey()方法，代码以下:

void touchWatchedKey(redisDb *db, robj *key) {

    list *clients;

    listIter li;

    listNode *ln;

    if (dictSize(db->watched_keys) == 0) return;

    // 1. 从redisDb->watched_keys中找到对应的client列表

    clients = dictFetchValue(db->watched_keys, key);

    if (!clients) return;

    /* Mark all the clients watching this key as CLIENT_DIRTY_CAS */

    /* Check if we are already watching for this key */

    listRewind(clients,&li);

    while((ln = listNext(&li))) {

        // 2.依次遍历client列表，给每一个client的flags字段

        // 开启CLIENT_DIRTY_CAS标识位

        client *c = listNodeValue(ln);

        c->flags |= CLIENT_DIRTY_CAS;

    }

}

touchWatchedKey()方法会作下面两件事:

从redisDb->watched_keys中找到监视这个key的client列表。前面在分析watch命令的时候说过，若是有client执行了watch keys命令，那么redis会以键值对的形式把(key,client)的对应关系保存在redisDb->watched_key这个字段里面。
对于第一步中找到的每一个client对象，都会给这个client的flags 字段开启CLIENT_DIRTY_CAS标志位。

在Redis里面全部会修改数据库内容的命令最后都会调用signalModifiedKey()这个方法，而在signalModifiedKey()会给全部的监视这个key的client增长CLIENT_DIRTY_CAS标志位。

exec命令

exec命令用来执行事务，对应的代码为execCommand()这个方法，实现以下:

void execCommand(client *c) {

    int j;

    robj **orig_argv;

    int orig_argc;

    struct redisCommand *orig_cmd;

    int must_propagate = 0; /* Need to propagate MULTI/EXEC to AOF / slaves? */

    // 1. 判断对应的client是否属于事务中

    if (!(c->flags & CLIENT_MULTI)) {

        addReplyError(c,"EXEC without MULTI");

        return;

    }

    /**

     * 2. 检查是否须要执行事务，在下面两种状况下不会执行事务

     * 1) 有被watch的key被其余的客户端修改了，对应于CLIENT_DIRTY_CAS标志位被开启

     * ,这个时候会返回一个nil，表示没有执行事务

     * 2) 有命令在加入事务队列的时候发生错误，对应于CLIENT_DIRTY_EXEC标志位被开启

     * ,这个时候会返回一个execaborterr错误

     */

    if (c->flags & (CLIENT_DIRTY_CAS|CLIENT_DIRTY_EXEC)) {

        addReply(c, c->flags & CLIENT_DIRTY_EXEC ? shared.execaborterr :

                                                  shared.nullmultibulk);

        // 取消全部的事务

        discardTransaction(c);

        goto handle_monitor;

    }

    /* Exec all the queued commands */

    // 3. unwatch全部被这个client watch的key

    unwatchAllKeys(c); /* Unwatch ASAP otherwise we'll waste CPU cycles */

    orig_argv = c->argv;

    orig_argc = c->argc;

    orig_cmd = c->cmd;

    addReplyMultiBulkLen(c,c->mstate.count);

    // 4. 依次执行事务队列中全部的命令

    for (j = 0; j < c->mstate.count; j++) {

        c->argc = c->mstate.commands[j].argc;

        c->argv = c->mstate.commands[j].argv;

        c->cmd = c->mstate.commands[j].cmd;

        /* Propagate a MULTI request once we encounter the first write op.

         * This way we'll deliver the MULTI/..../EXEC block as a whole and

         * both the AOF and the replication link will have the same consistency

         * and atomicity guarantees. */

        if (!must_propagate && !(c->cmd->flags & CMD_READONLY)) {

            execCommandPropagateMulti(c);

            must_propagate = 1;

        }

        call(c,CMD_CALL_FULL);

        /* Commands may alter argc/argv, restore mstate. */

        c->mstate.commands[j].argc = c->argc;

        c->mstate.commands[j].argv = c->argv;

        c->mstate.commands[j].cmd = c->cmd;

    }

    c->argv = orig_argv;

    c->argc = orig_argc;

    c->cmd = orig_cmd;

    // 5. 重置这个client对应的事务相关的全部的数据

    discardTransaction(c);

    /* Make sure the EXEC command will be propagated as well if MULTI

        * was already propagated. */

    if (must_propagate) server.dirty++;

handle_monitor:

    if (listLength(server.monitors) && !server.loading)

        replicationFeedMonitors(c,server.monitors,c->db->id,c->argv,c->argc);

}

execCommand()方法会作下面几件事:

判断对应的client是否已经处于事务中，若是不是，则直接返回错误。
判断时候须要执行事务中的命令。在下面两种状况下不会执行事务而是返回错误。
1. 有被监视的key被其余的客户端修改了，对应于CLIENT_DIRTY_CAS标志位被开启，这个时候会返回一个nil，表示没有执行事务。
2. 有命令在加入事务队列的时候发生错误，对应于CLIENT_DIRTY_EXEC标志位被开启，这个时候会返回一个execaborterr错误。
unwatch全部被这个client监视的key。
依次执行事务队列中全部的命令。
重置这个client对应的事务相关的全部的数据。

discard

使用discard命令能够取消一个事务，对应的方法为discardCommand(),实现以下:

void discardCommand(client *c) {

    // 1. 检查对应的client是否处于事务中

    if (!(c->flags & CLIENT_MULTI)) {

        addReplyError(c,"DISCARD without MULTI");

        return;

    }

    // 2. 取消事务

    discardTransaction(c);

    addReply(c,shared.ok);

}

discardCommand()方法首先判断对应的client是否处于事务中，若是不是则直接返回错误，不然的话会调用discardTransaction()方法取消事务，该方法实现以下:

void discardTransaction(client *c) {

    // 1. 释放全部跟MULTI/EXEC状态相关的资源

    freeClientMultiState(c);

    // 2. 初始化相应的状态

    initClientMultiState(c);

    // 3. 取消对应client的3个标志位

    c->flags &= ~(CLIENT_MULTI|CLIENT_DIRTY_CAS|CLIENT_DIRTY_EXEC);

    // 4.unwatch全部已经被watch的key

    unwatchAllKeys(c);

}

Other

Atomic:原子性

原子性是指一个事务（transaction）中的全部操做，要么所有完成，要么所有不完成，不会结束在中间某个环节。

对于Redis的事务来讲，事务队列中的命令要么所有执行完成，要么一个都不执行，所以Redis的事务是具备原子性的。

注意Redis不提供事务回滚机制。

Consistency:一致性

事务的一致性是指事务的执行结果必须是使事务从一个一致性状态变到另外一个一致性状态，不管事务是否执行成功。

命令加入事务队列失败(参数个数不对？命令不存在?)，整个事务不会执行。因此事务的一致性不会被影响。
使用了watch命令监视的key只事务期间被其余客户端修改，整个事务不会执行。也不会影响事务的一致性。
命令执行错误。若是事务执行过程当中有一个活多个命令错误执行失败，服务器也不会中断事务的执行，会继续执行事务中剩下的命令，而且已经执行的命令不会受任何影响。出错的命令将不会执行，也就不会对数据库作出修改，所以这种状况下事物的一致性也不会受到影响。
服务器宕机。服务器宕机的状况下的一致性能够根据服务器使用的持久化方式来分析。
1. 无持久化模式下，事务是一致的。这种状况下重启以后的数据库没有任何数据，所以老是一致的。
2. RDB模式下，事务也是一致的。服务器宕机重启以后能够根据RDB文件来恢复数据，从而将数据库还原到一个一致的状态。若是找不到可使用的RDB文件，那么重启以后数据库是空白的，那也是一致的。
3. AOF模式下，事务也是一致的。服务器宕机重启以后能够根据AOF文件来恢复数据，从而将数据库还原到一个一直的状态。若是找不到可使用的AOF文件，那么重启以后数据库是空白的，那么也是一致的。

Isolation:隔离性

Redis 是单进程程序，而且它保证在执行事务时，不会对事务进行中断，事务能够运行直到执行完全部事务队列中的命令为止。所以，Redis 的事务是老是带有隔离性的。

Durability:持久性

Redis事务并无提供任何的持久性功能，因此事务的持久性是由Redis自己所使用的持久化方式来决定的。

在单纯的内存模式下，事务确定是不持久的。
在RDB模式下，服务器可能在事务执行以后RDB文件更新以前的这段时间失败，因此RDB模式下的Redis事务也是不持久的。
在AOF的always模式下，事务的每条命令在执行成功以后，都会当即调用fsync或fdatasync将事务数据写入到AOF文件。可是，这种保存是由后台线程进行的，主线程不会阻塞直到保存成功，因此从命令执行成功到数据保存到硬盘之间，仍是有一段很是小的间隔，因此这种模式下的事务也是不持久的。
其余AOF模式也和always模式相似，因此它们都是不持久的。

结论：Redis的事务知足原子性、一致性和隔离性，可是不知足持久性。

Reference

Redis源码(3.2.28)
《Redis设计与实现》

另外，新关注咱们公众号的朋友，能够在公众号后台聊天框回复【1024】，能够免费获取2T的编程视频，算法、人工智能、Python、Java、Linux、Go、C语言、软考、英语等等资源。