Redis为何须要集群?node
首先Redis单实例主要有单点,容量有限,流量压力上限的问题。git
Redis单点故障,能够经过主从复制replication
,和自动故障转移sentinel
哨兵机制。github
但Redis单Master
实例提供读写服务,仍然有容量和压力问题,所以须要数据分区,构建多个Master
实例同时提供读写服务(不只限于从replica
节点提供读服务)。redis
那么就须要必定的机制保证数据分区。这样能充分把容量分摊到多台计算机,或能充分利用多核计算机的性能。算法
而且数据在各个主Master节点间不能混乱,固然最好还能支持在线数据热迁移的特性。shell
针对数据分区,通常来讲,分为两个大类:数据库
Master
节点。HashMap
, 采用 哈希算法,快速找到,快速设置。
假设有三个 Master,配置IP 和权重以下:编程
Real Server IP | weight |
---|---|
10.0.2.21 | 1 |
10.0.2.22 | 2 |
10.0.2.23 | 3 |
那么会根据每个real Server 及其权重虚拟出对应权重 weight 个的虚拟vritual server节点,映射关系会是:缓存
Real Server IP | virtual server |
---|---|
10.0.2.21 | 1 |
10.0.2.22 | 2,3 |
10.0.2.23 | 4,5,6 |
一个 key 存储在那个虚拟vritual server节点,经过哈希hash算法:服务器
virtual_server_index = hash(key) % (total_virtual_weight)
假设某个key,它的 hash 值是 10,那么以上: 10%6=4,将落到 10.0.2.23 这个真实的 Master上。
随机选取一个存储和访问。
通常结合 list
,用于非顺序性要求的消息队列场景。
一致性哈希算法(Consistent Hashing
)最先在论文《Consistent Hashing and Random Trees: Distributed Caching Protocols for Relieving Hot Spots on the World Wide Web》中被提出。
简单来讲,一致性哈希将整个哈希值空间组织成一个虚拟的圆环,如假设某哈希函数H的值空间为0-2^32-1(即哈希值是一个32位无符号整形),整个哈希空间环以下:
1.有一个HASH环,环上每一个节点都是一个天然数,从0开始顺时针递增,直到2^32-1,最后回到0
2.真实节点 M1 M2 M3 经过 hash(IP 或主机名)肯定在哈希环上的位置
3.当客户端请求时,首先 hash(key) 肯定在哈希环上的位置,而后顺时针日后找,找到的第一个真实节点,就是客户端须要请求访问的真实主机
优势:
哈希一致性实际上是对固定取模的一种优化。
(1)扩展性:当增长节点时,只会影响顺时针的真实节点(此部分数据比较难迁移),而不是影响所有的节点。
(2)容错性:当节点宕机或删除节点时,只会影响逆时针的真实节点,而不是影响所有的节点。
(3)平衡性:当哈希算法的节点过少时,会可能形成某些服务器的数据存储较多,而另一些存储较少,形成数据倾斜,当节点足够多时,这种现象得以缓解。
所以虚拟节点个数较大的时候,数据的平衡性得以保证。
缺点:
由于当增删节点时,须要从新计算受影响部分的节点中的key所有找出来,才能迁移,这个很麻烦!!!
Redis在此种用法下,也只能当缓存,不能当存储数据库!
这个跟哈希一致性很类似。
区别在于,它预先分配好真实节点管理的哈希槽(slot
),并存储管理起来,咱们能够预先知道哪一个master主机拥有哪些哈希槽(slot
),这里总数是16384。
127.0.0.1:7001> cluster nodes 2aaf59558f1b9f493a946a695e51711eb03d15f9 127.0.0.1:7002@17002 master - 0 1590126183862 2 connected 5461-10922 6439c3e9468fd2c545a63b3b9bfe658c5fc14287 127.0.0.1:7003@17003 master - 0 1590126181856 3 connected 10923-16383 340d985880c23de9816226dff5fd903322e44313 127.0.0.1:7001@17001 myself,master - 0 1590126182000 1 connected 0-5460
咱们能够清晰看到Redis Cluster中的每个master节点管理的哈希槽。
好比 127.0.0.1:7001 拥有哈希槽 0-5460, 127.0.0.1:7002 拥有哈希槽 5461-10922, 127.0.0.1:7003 拥有哈希槽 10923-16383。
➜ redis-cli -p 7001 127.0.0.1:7001> set a 1 (error) MOVED 15495 127.0.0.1:7003 ➜ redis-cli -p 7001 -c 127.0.0.1:7001> set a 1 -> Redirected to slot [15495] located at 127.0.0.1:7003 OK
咱们看到的是master节点在 Redis Cluster中的实现时,都存有全部的路由信息。
当客户端的key 通过hash运算,发送slot
槽位不在本节点的时候。
(1)若是是非集群方式链接,则直接报告错误给client,告诉它应该访问集群中那个IP的master主机。
(2)若是是集群方式链接,则将客户端重定向到正确的节点上。
注意这里并非127.0.0.1:7001 帮client去链接127.0.0.1:7003获取数据的,而是将客户端请求重定向了。
优势:
继承并加强一致性哈希的容错性,扩展性,以及平衡性。
Redis在此种用法下,能够当缓存,也能当存储数据库!
这里Redis给出更详细的说明:https://redis.io/topics/partitioning
如下列表为按照出现的前后顺序排列:
方案 | 描述 | 数据分区支持策略 | 分布式 | 在线数据热迁移 |
---|---|---|---|---|
twemproxy | twitter 开源的redis代理中间件,不修改redis源码 https://github.com/twitter/twemproxy | 存在modula(固定取模)、 random (随机)、ketama(哈希一致性)三种可选的配置 | 自己是单点的,能够经过keepalived等保证高可用 | 不支持,没法平滑地扩容/缩容 |
Redis Cluster | 官方提供的集群方案 | 采用预先分片(PreSharding),即哈希槽方式,存储在每个master节点上 | 没有proxy代理层,客户端能够链接集群中的任意master节点 | 提供客户端命令redis-cli --cluster reshard ip port 按哈希槽迁移指定节点的数据 |
codis | 豌豆荚开源的redis代理中间件,修改了redis源码 https://github.com/CodisLabs/codis | 采用预先分片(PreSharding),即哈希槽方式,存储在ZooKeeper上 | 集群部署,部署相对复杂 | 支持数据热迁移 |
Spring
提供的 RedisTemplate
之类封装好的 fat client ,能够采用@SvenAugustus(https://www.flysium.xyz/)
更多请关注微信公众号【编程不离宗】,专一于分享服务器开发与编程相关的技术干货: