在开发测试环境中,咱们通常搭建Redis的单实例来应对开发测试需求,可是在生产环境,若是对可用性、可靠性要求较高,则须要引入Redis的集群方案。虽然如今各大云平台有提供缓存服务能够直接使用,但了解一下其背后的实现与原理总仍是有些必要(好比面试), 本文就一块儿来学习一下Redis的几种集群方案。html
Redis支持三种集群方案node
主从复制模式中包含一个主数据库实例(master)与一个或多个从数据库实例(slave),以下图面试
客户端可对主数据库进行读写操做,对从数据库进行读操做,主数据库写入的数据会实时自动同步给从数据库。redis
具体工做机制为:算法
本示例基于Redis 5.0.3版。shell
redis.conf的主要配置数据库
###网络相关###
# bind 127.0.0.1 # 绑定监听的网卡IP,注释掉或配置成0.0.0.0可以使任意IP都可访问
protected-mode no # 关闭保护模式,使用密码访问
port 6379 # 设置监听端口,建议生产环境均使用自定义端口
timeout 30 # 客户端链接空闲多久后断开链接,单位秒,0表示禁用
###通用配置###
daemonize yes # 在后台运行
pidfile /var/run/redis_6379.pid # pid进程文件名
logfile /usr/local/redis/logs/redis.log # 日志文件的位置
###RDB持久化配置###
save 900 1 # 900s内至少一次写操做则执行bgsave进行RDB持久化
save 300 10
save 60 10000
# 若是禁用RDB持久化,可在这里添加 save ""
rdbcompression yes #是否对RDB文件进行压缩,建议设置为no,以(磁盘)空间换(CPU)时间
dbfilename dump.rdb # RDB文件名称
dir /usr/local/redis/datas # RDB文件保存路径,AOF文件也保存在这里
###AOF配置###
appendonly yes # 默认值是no,表示不使用AOF增量持久化的方式,使用RDB全量持久化的方式
appendfsync everysec # 可选值 always, everysec,no,建议设置为everysec
###设置密码###
requirepass 123456 # 设置复杂一点的密码
复制代码
部署主从复制模式只需稍微调整slave的配置,在redis.conf中添加缓存
replicaof 127.0.0.1 6379 # master的ip,port
masterauth 123456 # master的密码
replica-serve-stale-data no # 若是slave没法与master同步,设置成slave不可读,方便监控脚本发现问题
复制代码
本示例在单台服务器上配置master端口6379,两个slave端口分别为7001,7002,启动master,再启动两个slavebash
[root@dev-server-1 master-slave]# redis-server master.conf
[root@dev-server-1 master-slave]# redis-server slave1.conf
[root@dev-server-1 master-slave]# redis-server slave2.conf
复制代码
进入master数据库,写入一个数据,再进入一个slave数据库,当即即可访问刚才写入master数据库的数据。以下所示服务器
[root@dev-server-1 master-slave]# redis-cli
127.0.0.1:6379> auth 123456
OK
127.0.0.1:6379> set site blog.jboost
OK
127.0.0.1:6379> get site
"blog.jboost"
127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:2
slave0:ip=127.0.0.1,port=7001,state=online,offset=13364738,lag=1
slave1:ip=127.0.0.1,port=7002,state=online,offset=13364738,lag=0
...
127.0.0.1:6379> exit
[root@dev-server-1 master-slave]# redis-cli -p 7001
127.0.0.1:7001> auth 123456
OK
127.0.0.1:7001> get site
"blog.jboost"
复制代码
执行info replication
命令能够查看链接该数据库的其它库的信息,如上可看到有两个slave链接到master
优势:
缺点:
哨兵模式基于主从复制模式,只是引入了哨兵来监控与自动处理故障。如图
哨兵顾名思义,就是来为Redis集群站哨的,一旦发现问题能作出相应的应对处理。其功能包括
哨兵模式的具体工做机制:
在配置文件中经过 sentinel monitor <master-name> <ip> <redis-port> <quorum>
来定位master的IP、端口,一个哨兵能够监控多个master数据库,只须要提供多个该配置项便可。哨兵启动后,会与要监控的master创建两条链接:
_sentinel_:hello
频道与获取其余监控该master的哨兵节点信息与master创建链接后,哨兵会执行三个操做:
_sentinel_:hello
频道发送本身的信息发送INFO命令能够获取当前数据库的相关信息从而实现新节点的自动发现。因此说哨兵只须要配置master数据库信息就能够自动发现其slave信息。获取到slave信息后,哨兵也会与slave创建两条链接执行监控。经过INFO命令,哨兵能够获取主从数据库的最新信息,并进行相应的操做,好比角色变动等。
接下来哨兵向主从数据库的_sentinel_:hello频道发送信息与一样监控这些数据库的哨兵共享本身的信息,发送内容为哨兵的ip端口、运行id、配置版本、master名字、master的ip端口还有master的配置版本。这些信息有如下用处:
若是被PING的数据库或者节点超时(经过 sentinel down-after-milliseconds master-name milliseconds
配置)未回复,哨兵认为其主观下线(sdown,s就是Subjectively —— 主观地)。若是下线的是master,哨兵会向其它哨兵发送命令询问它们是否也认为该master主观下线,若是达到必定数目(即配置文件中的quorum)投票,哨兵会认为该master已经客观下线(odown,o就是Objectively —— 客观地),并选举领头的哨兵节点对主从系统发起故障恢复。若没有足够的sentinel进程赞成master下线,master的客观下线状态会被移除,若master从新向sentinel进程发送的PING命令返回有效回复,master的主观下线状态就会被移除
哨兵认为master客观下线后,故障恢复的操做须要由选举的领头哨兵来执行,选举采用Raft算法:
选出领头哨兵后,领头者开始对系统进行故障恢复,从出现故障的master的从数据库中挑选一个来当选新的master,选择规则以下:
挑选出须要继任的slave后,领头哨兵向该数据库发送命令使其升格为master,而后再向其余slave发送命令接受新的master,最后更新数据。将已经中止的旧的master更新为新的master的从数据库,使其恢复服务后以slave的身份继续运行。
本示例基于Redis 5.0.3版。
哨兵模式基于前文的主从复制模式。哨兵的配置文件为sentinel.conf,在文件中添加
sentinel monitor mymaster 127.0.0.1 6379 1 # mymaster定义一个master数据库的名称,后面是master的ip, port,1表示至少须要一个Sentinel进程赞成才能将master判断为失效,若是不知足这个条件,则自动故障转移(failover)不会执行
sentinel auth-pass mymaster 123456 # master的密码
sentinel down-after-milliseconds mymaster 5000 # 5s未回复PING,则认为master主观下线,默认为30s
sentinel parallel-syncs mymaster 2 # 指定在执行故障转移时,最多能够有多少个slave实例在同步新的master实例,在slave实例较多的状况下这个数字越小,同步的时间越长,完成故障转移所需的时间就越长
sentinel failover-timeout mymaster 300000 # 若是在该时间(ms)内未能完成故障转移操做,则认为故障转移失败,生产环境须要根据数据量设置该值
复制代码
一个哨兵能够监控多个master数据库,只需按上述配置添加多套
分别以26379,36379,46379端口启动三个sentinel
[root@dev-server-1 sentinel]# redis-server sentinel1.conf --sentinel
[root@dev-server-1 sentinel]# redis-server sentinel2.conf --sentinel
[root@dev-server-1 sentinel]# redis-server sentinel3.conf --sentinel
复制代码
也可使用redis-sentinel sentinel1.conf
命令启动。此时集群包含一个master、两个slave、三个sentinel,如图,
咱们来模拟master挂掉的场景,执行 kill -9 3017
将master进程干掉,进入slave中执行 info replication
查看,
[root@dev-server-1 sentinel]# redis-cli -p 7001
127.0.0.1:7001> auth 123456
OK
127.0.0.1:7001> info replication
# Replication
role:slave
master_host:127.0.0.1
master_port:7002
master_link_status:up
master_last_io_seconds_ago:1
master_sync_in_progress:0
# 省略
127.0.0.1:7001> exit
[root@dev-server-1 sentinel]# redis-cli -p 7002
127.0.0.1:7002> auth 123456
OK
127.0.0.1:7002> info replication
# Replication
role:master
connected_slaves:1
slave0:ip=127.0.0.1,port=7001,state=online,offset=13642721,lag=1
# 省略
复制代码
能够看到slave 7002已经成功上位晋升为master(role:master),接收一个slave 7001的链接。此时查看slave2.conf配置文件,发现replicaof
的配置已经被移除了,slave1.conf的配置文件里replicaof 127.0.0.1 6379
被改成 replicaof 127.0.0.1 7002
。从新启动master,也能够看到master.conf配置文件中添加了replicaof 127.0.0.1 7002
的配置项,可见大哥(master)下位后,再出来混就只能当当小弟(slave)了,三十年河东三十年河西。
优势:
缺点:
哨兵模式解决了主从复制不能自动故障转移,达不到高可用的问题,但仍是存在难以在线扩容,Redis容量受限于单机配置的问题。Cluster模式实现了Redis的分布式存储,即每台节点存储不一样的内容,来解决在线扩容的问题。如图
Cluster采用无中心结构,它的特色以下:
Cluster模式的具体工做机制:
Cluster模式集群节点最小配置6个节点(3主3从,由于须要半数以上),其中主节点提供读写操做,从节点做为备用节点,不提供请求,只做为故障转移使用。
本示例基于Redis 5.0.3版。
Cluster模式的部署比较简单,首先在redis.conf中
port 7100 # 本示例6个节点端口分别为7100,7200,7300,7400,7500,7600
daemonize yes # r后台运行
pidfile /var/run/redis_7100.pid # pidfile文件对应7100,7200,7300,7400,7500,7600
cluster-enabled yes # 开启集群模式
masterauth passw0rd # 若是设置了密码,须要指定master密码
cluster-config-file nodes_7100.conf # 集群的配置文件,一样对应7100,7200等六个节点
cluster-node-timeout 15000 # 请求超时 默认15秒,可自行设置
复制代码
分别以端口7100,7200,7300,7400,7500,7600 启动六个实例(若是是每一个服务器一个实例则配置可同样)
[root@dev-server-1 cluster]# redis-server redis_7100.conf
[root@dev-server-1 cluster]# redis-server redis_7200.conf
...
复制代码
而后经过命令将这个6个实例组成一个3主节点3从节点的集群,
redis-cli --cluster create --cluster-replicas 1 127.0.0.1:7100 127.0.0.1:7200 127.0.0.1:7300 127.0.0.1:7400 127.0.0.1:7500 127.0.0.1:7600 -a passw0rd
复制代码
执行结果如图
能够看到 7100, 7200, 7300 做为3个主节点,分配的slot分别为 0-5460, 5461-10922, 10923-16383, 7600做为7100的slave, 7500做为7300的slave,7400做为7200的slave。
咱们链接7100设置一个值
[root@dev-server-1 cluster]# redis-cli -p 7100 -c -a passw0rd
Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe.
127.0.0.1:7100> set site blog.jboost
-> Redirected to slot [9421] located at 127.0.0.1:7200
OK
127.0.0.1:7200> get site
"blog.jboost"
127.0.0.1:7200>
复制代码
注意添加 -c 参数表示以集群模式,不然报 (error) MOVED 9421 127.0.0.1:7200
错误, 以 -a 参数指定密码,不然报(error) NOAUTH Authentication required
错误。
从上面命令看到key为site算出的slot为9421,落在7200节点上,因此有Redirected to slot [9421] located at 127.0.0.1:7200
,集群会自动进行跳转。所以客户端能够链接任何一个节点来进行数据的存取。
经过cluster nodes
可查看集群的节点信息
127.0.0.1:7200> cluster nodes
eb28aaf090ed1b6b05033335e3d90a202b422d6c 127.0.0.1:7500@17500 slave c1047de2a1b5d5fa4666d554376ca8960895a955 0 1584165266071 5 connected
4cc0463878ae00e5dcf0b36c4345182e021932bc 127.0.0.1:7400@17400 slave 5544aa5ff20f14c4c3665476de6e537d76316b4a 0 1584165267074 4 connected
dbbb6420d64db22f35a9b6fa460b0878c172a2fb 127.0.0.1:7100@17100 master - 0 1584165266000 1 connected 0-5460
d4b434f5829e73e7e779147e905eea6247ffa5a2 127.0.0.1:7600@17600 slave dbbb6420d64db22f35a9b6fa460b0878c172a2fb 0 1584165265000 6 connected
5544aa5ff20f14c4c3665476de6e537d76316b4a 127.0.0.1:7200@17200 myself,master - 0 1584165267000 2 connected 5461-10922
c1047de2a1b5d5fa4666d554376ca8960895a955 127.0.0.1:7300@17300 master - 0 1584165268076 3 connected 10923-16383
复制代码
咱们将7200经过 kill -9 pid
杀死进程来验证集群的高可用,从新进入集群执行cluster nodes
能够看到7200 fail了,可是7400成了master,从新启动7200,能够看到此时7200已经变成了slave。
优势:
缺点:
Redis Cluster模式不建议使用pipeline和multi-keys操做,减小max redirect产生的场景。
本文介绍了Redis集群方案的三种模式,其中主从复制模式能实现读写分离,可是不能自动故障转移;哨兵模式基于主从复制模式,能实现自动故障转移,达到高可用,但与主从复制模式同样,不能在线扩容,容量受限于单机的配置;Cluster模式经过无中心化架构,实现分布式存储,可进行线性扩展,也能高可用,但对于像批量操做、事务操做等的支持性不够好。三种模式各有优缺点,可根据实际场景进行选择。
参考:
做者:空山新雨,一枚仍在学习路上的大龄码农
近期做者写了几十篇技术博客,内容包括Java、Spring Boot、Spring Cloud、Docker,技术管理心得等
欢迎关注做者微信公众号:空山新雨的技术空间,一块儿学习成长