Redis高可用

时间 2019-11-16

标签 redis 可用栏目 Redis 繁體版

原文原文链接

1、reids集群

一、扩容集群

准备新节点 =》加入集群 =》迁移槽和数据
新节点：前端

集群模式
配置和其余节点统一
孤立节点

加入集群做用node

为它迁移槽和数据实现扩容
做为从节点负责故障转移
建议使用redis-trib.rb可以避免新节点加入其余集群，形成故障
迁移槽和数据
槽迁移计划
迁移数据
对目标节点发送
添加从节点

步骤redis

目标节点准备导入槽
源节点准备导出槽
获取slot下count个键
批量迁移相关键的数据
循环迁移键

redis-cli -p 7000 cluster meet 127.0.0.1 7006
redis-trib.rb reshard 127.0.0.1 7000

二、收缩扩容

下线迁移槽
忘记节点：cluster forget downNodeId
关闭节点算法

redis-trib.rb reshard --from nodeId --to nodeId --slots 1366 127.0.0.1:7000
redis-trib.rb del-node 127.0.0.1:7000 nodeIdsql

三、客户端路由

moved重定向数据库

发送键命令
计算槽和对应节点
回复moved
重定向发送命令

槽命中：直接返回
槽命不中：moved异常
ask重定向后端

发送键命令
回复ask转向
asking
发送命令
响应结果

moved和ask：二者都是客户端重定向，moved槽已经肯定迁移，ask槽还在迁移中
smart客户端缓存

从集群中选一个可运行节点，使用cluster slots初始化槽和节点映射
将cluster slots的结果映射到本地，为每一个节点建立JedisPool
准备执行命令

批量优化的方法：
串行mget，串行IO，并行IO，hash_tag服务器

四、故障转移

故障发现：
经过ping/pong消息实现故障发现，不须要sentinel
主观下线和客观下线网络

主观下线：某个节点认为另外一个节点不可用，偏见
客观下线：当半数以上持有槽的主节点都标记某节点主观下线

故障恢复：

资格检查

每一个节点检查与故障主节点的断线时间
超过cluster-node-timeout * cluster-slave-validity-factor取消资格
cluster-slave-validity-factor：默认是10

准备选举时间

选举投票

替换主节点

当前从节点取消复制为主节点
执行clusterDelSlot撤销故障主节点负责的槽，并执行clusterAddSlot把这些槽分配给本身
向集群广播本身的pong消息，代表已经替换了故障从节点

五、集群完整性

cluster-require-full-coverage默认为yes

集群中16384个槽所有可用：保证集群完整性
节点故障或者正在故障转移

大多业务没法容忍，cluster-require-full-coverage建议设置为no

带宽消耗

官方建议: 1000个节点
PING/PONG消息
不容忽视的带宽消耗

三个方面：消息发送频率；消息数据量；节点部署的机器规模

避免大集群：避免多业务使用一个集群，大业务能够多集群
cluster-node-timeout：带宽和故障转移速度的均衡
尽可能均匀分配到多机器上：保证高可用和带宽

数据倾斜

节点和槽分配不均

redis-trib.rb info ip:port查看节点，槽，键值分布
redis-trib.rb rebalance ip:port从新分配槽，节点，键值

不一样槽对应键值数量差别较大
包含bigkey
内存相关配置不一致

请求倾斜

热点key：重要的key或者bigkey
优化：
避免bigkey
热键不要使用hash_tag
当一致性不高时，可用使用本地缓存 + MQ

集群读写分离

只读链接：集群模式的从节点不接受任何读写请求

重定向到负责槽的主节点
readonly命令能够读链接级别的命令

读写分离：更加复杂

一样的问题：复制延迟读取过时数据从节点故障
修改客户端：cluster slaves nodeId

数据迁移
官方迁移工具：redis-trib.rb import
只能从单机迁移到集群
不支持在线迁移：source须要停写
不支持断点续传
单线程迁移：影响速度

集群和单机

集群限制
key批量操做支持有限：mget，mset必须再一个slot
key事物和lua支持有限：操做的key必须在一个节点
key时数据分区的最小粒度：不支持bigkey分区
不支持多个数据库：集群模式下只有一个db 0
复制只支持一层：不支持树形复制结构

2、reids缓存成本和收益

一、缓存的受益和成本

受益：

加速读写

经过缓存加速读写速度

下降后端负载

后端服务器经过前端缓存下降负载，业务端使用Redis下降后端Mysql负载

成本：

数据不一致：

缓存从和数据层有时间窗口不一致，和更新策略有关

代码维护成本

多了一层缓存逻辑

运维成本

使用场景

下降后端负载

对高消耗的SQL=>join结果集/分组统计结果缓存

加速请求响应

利英Redis/Memcache优化IO响应时间

大量写合并为批量写

如计数器先Redis累加再批量写DB

二、缓存更新策略

LRU/LFU/FIFO算法剔除
超时剔除
主动更新：开发控制生命周期

建议
低一致性：最大内存和淘汰策略
高一致性 超时剔除和主动更新结合，最大内存和淘汰策略兜底

三、缓存粒度控制

通用性：全量属性更好
占用空间：部分属性更好
代码维护：表面上全量属性更好

四、缓存穿透问题

大量请求不命中
缘由：

业务代码自身问题
恶意攻击，爬虫等等

发现：

业务的响应时间
业务自己问题
相关指标总调用数缓存层命中数存储层命中数

解决方案：

缓存空对象
两个问题：
须要更多的键
缓存层和存储层数据短时间不一致
布隆过滤器拦截

五、缓存雪崩优化

因为cache服务承载大量请求，当cache服务器异常/脱机，流量直接压向后端组建，形成级联故障

优化方案：
保证缓存高可用性

个别节点，个别机器，甚至是机房
依赖隔离组件为后端限流
提早演练：例如压力测试

六、无底洞优化

优化IO的几种方法

命令自己优化：例如慢查询keys hgetall bigkey
减小网络通讯次数
下降接入成本：例如客户端长链接/链接池 NIO等
串行mget 串行IO 并行IO hash_tag

七、热点key的重建优化

三个目标

减小重缓存的次数
数据尽量一致
减小潜在危险
两个解决
互斥锁
永远不过时

缓存层面：没有设置过时时间
功能层面：为每一个value添加逻辑过时时间，但发现超过逻辑过时时间后，会使用单独的线程去构建缓存

缓存收益：加速读写，下降后端存储负载缓存成本缓存和存储数据不一致性代码维护成本运维成本推荐结合剔除、超时、主动更新三种方案共同完成穿透问题：使用缓存空对象和布隆过滤器来解决，注意他们各自的使用场景和局限性无底洞问题：分布式缓存中，有更多的机器不保证有更高的性能雪崩问题：缓存层高可用，客户端降级提早演练热点key问题互斥锁永远不过时可以子啊必定程度上解决热点key的问题

1. 【Redis】高可用
2. Redis高可用
3. redis 高可用
4. redis高可用
5. Redis高可用之Redis Sentinel
6. 高可用Redis(九)：Redis Sentinel
7. redis高可用之REDIS SENTINEL
8. Redis的高可用
9. redis的高可用
10. redis高可用-sentinel
更多相关文章...
• PHP 可用的函数 - PHP参考手册
• 使用流水线（pipelined）提高Redis的命令性能 - Redis教程
• Git可视化极简易教程 — Git GUI使用方法
• Composer 安装与使用