RabbitMQ 在分布式系统的应用

时间 2019-12-04

原文原文链接

因为以前作的项目中须要在多个节点之间可靠地通讯，因此废弃了以前使用的Redis pub/sub（由于集群有单点问题，且有诸多限制），改用了RabbitMQ。
使用期间获得很多收获，也踩了很多坑，因此在此分享下心得。（简单了解下RabbitMQ? 详见下文：简介）html

怎么保证可靠性的？

RabbitMQ提供了几种特性，牺牲了一点性能代价，提供了可靠性的保证。java

1. 持久化 node

当RabbitMQ退出时，默认会将消息和队列都清除，因此须要在第一次声明队列和发送消息时指定其持久化属性为true，这样RabbitMQ会将队列、消息和状态存到RabbitMQ本地的数据库，重启后会恢复。 git

java：github

durable=true   
channel.queueDeclare("task_queue", durable, false, false, null); // 队列  
channel.basicPublish("", "task_queue",
    MessageProperties.PERSISTENT_TEXT_PLAIN,
    message.getBytes()); // 消息

注：当声明的队列已经存在时，尝试从新定义它的durable是不生效的。docker

2. 接收应答 数据库

客户端接收消息的模式默认是自动应答，可是经过设置autoAck为false可让客户端主动应答消息。当客户端拒绝此消息或者未应答便断开链接时，就会使得此消息从新入队（在版本2.7.0之前是到从新加入到队尾，2.7.0及之后是保留消息在队列中的原来位置）。缓存

java：服务器

autoAck = false;
requeue = true;
channel.basicConsume(queue, autoAck, callback);
channel.basicAck();//应答
channel.basicReject(deliveryTag, requeue); // 拒绝
channel.basicRecover(requeue); // 恢复

3. 发送确认 cookie

默认状况下，发送端不关注发出去的消息是否被消费掉了。可设置channel为confirm模式，全部发送的消息都会被确认一次，用户能够自行根据server发回的确认消息查看状态。详细介绍见：confirms

java：

channel.confirmSelect(); // 进入confirm模式
// do publish messages... 每条消息都会被编号，从1开始
channel.getNextPublishSeqNo() // 查看下一条要发送的消息的序号
channel.waitForConfirms(); // 等待全部消息发送并确认

4. 事务

和confirm模式不能同时使用，并且会带来大量的多余开销，致使吞吐量降低不少，故而不推荐。

java：

channel.txSelect();
try {
    // do something...
    channel.txCommit();
} catch (e){
    channel.txRollback();
}

5. <a name="ha" /> 消息队列的高可用（主备模式）

相比于路由和绑定，能够视为是共享于全部的节点的，消息队列默认只存在于第一次声明它的节点上，这样一旦这个节点挂了，这个队列中未处理的消息就没有了。

幸亏，RabbitMQ提供了将它备份到其余节点的机制，任什么时候候都有一个master负责处理请求，其余slaves负责备份，当master挂掉，会将最先建立的那个slave提高为master。

命令：

rabbitmqctl set_policy ha-all "^ha\." '{"ha-mode":"all"}'

设置全部以'ha'开头的queue在全部节点上拥有备份。详细语法点这里，也能够在界面上配置。

注：因为exclusive类型的队列会在client和server链接断开时被删掉，因此对它设置持久化属性和备份都是没有意义的。

6. 顺序保证

直接上图好了：

一些须要注意的地方

1. 集群配置

一个集群中多个节点共享一份.erlang.cookie文件；如果没有启用RABBITMQ_USE_LONGNAME，须要在每一个节点的hosts文件中指定其余节点的地址，否则会找不到其余集群中的节点。

2. 脑裂（网络分区）

RabbitMQ集群对于网络分区的处理和忍受能力不太好，推荐使用federation或者shovel插件去解决。federation详见高级->Federation

可是，状况已经发生了，怎么去解决呢？放心，仍是有办法恢复的。

当网络断断续续时，会使得节点之间的通讯断掉，进而形成集群被分隔开的状况。

这样，每一个小集群以后便只处理各自本地的链接和消息，从而致使数据不一样步。当从新恢复网络链接时，它们彼此都认为是对方挂了-_-||，即可以判断出有网络分区出现了。可是RabbitMQ默认是忽略掉不处理的，形成两个节点继续各自为政（路由，绑定关系，队列等能够独立地建立删除，甚至主备队列也会每一方拥有本身的master）。

能够更改配置使得链接恢复时，会根据配置自动恢复：

ignore：默认，不作任何处理
pause-minority：断开链接时，判断当前节点是否属于少数派（节点数少于或者等于一半），若是是，则暂停直到恢复链接。
{pause_if_all_down, [nodes], ignore | autoheal}：断开链接时，判断当前集群中节点是否有节点在nodes中，若是有，则继续运行，不然暂停直到恢复链接。这种策略下，当恢复链接时，可能会有多个分区存活，因此，最后一个参数决定它们怎么合并。
autoheal：当恢复链接时，选择客户端链接数最多的节点状态为主，重启其余节点。

配置：集群配置

3. 屡次ack

客户端屡次应答同一条消息，会使得该客户端收不到后续消息。

结合Docker使用

集群版本的实现：详见我本身写的一个例子rabbitmq-server-cluster

消息队列中间件的比较

RabbitMQ
- 优势：支持不少协议如：AMQP，XMPP，STMP，STOMP；灵活的路由；成熟稳定的集群方案；负载均衡；数据持久化等。
- 缺点：速度较慢；比较重量级，安装须要依赖Erlang环境。
Redis
- 优势：比较轻量级，易上手
- 缺点：单点问题，功能单一
Kafka：
- 优势：高吞吐；分布式；快速持久化；负载均衡；轻量级
- 缺点：极端状况下会丢消息

最后附一张网上截取的测试结果:

若是有兴趣简单了解下RabbitMQ的简单介绍，能够继续往下看～

简介

几个重要的概念：

Virtual Host 包含若干个Exchange和Queue，表示一个节点；
Exchange 接受客户端发送的消息，并根据Binding将消息路由给服务器中的队列，Exchange分为direct, fanout, topic三种。
Binding 链接Exchange和Queue，包含路由规则。
Queue 消息队列，存储还未被消费的消息。
Message Header+Body
Channel 通道，执行AMQP的命令；一个链接可建立多个通道以节省资源。

Client

RabbitMQ官方实现了不少热门语言的客户端，就不一一列举啦，以java为例，直接开始正题：

1. 创建链接

ConnectionFactory factory = new ConnectionFactory();
factory.setHost("localhost");

能够加上断开重试机制：

factory.setAutomaticRecoveryEnabled(true);
factory.setNetworkRecoveryInterval(10000);

建立链接和通道：

Connection connection = factory.newConnection();
Channel channel = connection.createChannel();

2. 一对一：一个生产者，一个消费者

生产者：

channel.queueDeclare(QUEUE_NAME, false, false, false, null);
channel.basicPublish("", QUEUE_NAME, null, message.getBytes());

消费者：

Consumer consumer = new DefaultConsumer(channel) {
  @Override
  public void handleDelivery(String consumerTag, Envelope envelope, AMQP.BasicProperties properties, byte[] body)
      throws IOException {
    String message = new String(body, "UTF-8");
    System.out.println(" [x] Received '" + message + "'");
  }
};
channel.basicConsume(QUEUE_NAME, autoAck, consumer);

3. 一对多：一个生产者，多个消费者

代码同上，只不过会有多个消费者，消息会轮序发给各个消费者。

若是设置了autoAck=false，那么能够实现公平分发（即对于某个特定的消费者，每次最多只发送指定条数的消息，直到其中一条消息应答后，再发送下一条）。须要在消费者中加上:

int prefetchCount = 1;
channel.basicQos(prefetchCount);

其余同上。

4. 广播

生产者：

channel.exchangeDeclare(EXCHANGE_NAME, "fanout");
String queueName = channel.queueDeclare().getQueue();
channel.queueBind(queueName, EXCHANGE_NAME, "");
channel.basicPublish(EXCHANGE_NAME, "", null, message.getBytes());

消费者同上。

5. Routing：指定路由规则

生产者：

String queueName = channel.queueDeclare().getQueue();
channel.queueBind(queueName, EXCHANGE_NAME, routingKey);
channel.basicPublish(EXCHANGE_NAME, routingKey, null, message.getBytes());

消费者同上。

6. Topics：支持通配符的Routing

* 能够表示一个单词
# 能够表示一个或多个单词

生产者：

channel.exchangeDeclare(EXCHANGE_NAME, "topic");
String queueName = channel.queueDeclare().getQueue();
channel.queueBind(queueName, EXCHANGE_NAME, bindingKey);

消费者同上。

7. RPC

其实就是一对一模式的一种用法：

首先，客户端发送一条消息到服务端声明的队列，消息属性中包含reply_to和correlation_id

reply_to 是客户端建立的消息的队列，用来接收远程调用结果
correlation_id 是消息的标识，服务端回应的消息属性中会带上以便知道是哪条消息的结果。

而后，服务端接收到消息，处理，并返回一条结果到reply_to队列中，

最终，客户端接收到返回消息，继续向下处理。

Server

支持各大主流操做系统，这里以Unix为例介绍下经常使用配置和命令：

安装：

因为RabbitMQ是依赖于Erlang的，因此得首先安装最近版本的Erlang。

单点的安装比较简单，下载解压便可。下载地址

配置：（通常的，用默认的便可）

$RABBITMQ_HOME/etc/rabbitmq/rabbitmq-env.conf: 环境变量默认配置（也可在启动脚本中设置，且以启动命令中的配置为准）。经常使用的有：
- RABBITMQ_NODENAME：节点名称，默认是rabbit@$HOSTNAME。
- RABBITMQ_NODE_PORT：协议端口号，默认5672。
- RABBITMQ_SERVER_START_ARGS：覆盖rabbitmq.config中的一些配置。
$RABBITMQ_HOME/etc/rabbitmq/rabbitmq.config: 核心组件，插件，erlang服务等配置，经常使用的有：
- disk_free_limit：队列持久化等信息都是存到RabbitMQ本地的数据库中的，默认限制50000000（也就是最多只让它使用50M空间啦，不够能够上调，也支持空闲空间百分比的配置）。要是超标了，它就罢工了……
- vm_memory_high_watermark：内存使用，默认0.4（最多让它使用40%的内存，超标罢工）

注：若启动失败了，能够在启动日志中查看到具体的错误信息。

命令：

$RABBITMQ_HOME/sbin/rabbitmq-server：启动脚本，会打印出配置文件，插件，集群等信息；加上-detached为后台启动；
/sbin/rabbitmqctl status：查看启动状态
/sbin/rabbitmqctl add_user admin admin：添加新用户admin，密码admin；默认只有一个guest用户，但只限本机访问。
/sbin/rabbitmqctl set_user_tags admin administrator：将admin设置为管理员权限
/sbin/rabbitmqctl set_permissions -p / admin ".*" ".*" ".*" 赋予admin全部权限
/sbin/rabbitmqctl stop：关闭

集群

集群节点共享全部的状态和数据，如：用户、路由、绑定等信息（队列有点特殊，虽然从全部节点均可达，可是只存在于第一次声明它的那个节点上，解决方案：详见上文：消息队列的高可用；每一个节点均可以接收链接，处理数据。

集群节点有两种，disc：默认，信息存在本地数据库；ram：加入集群时，添加--ram参数，信息存在内存，可提升性能。

配置：（通常的，用默认的便可。）

$RABBITMQ_HOME/etc/rabbitmq/rabbitmq-env.conf：
- RABBITMQ_USE_LONGNAME：默认false，(默认的，RABBITMQ_NODENAME中@后面的$HOSTNAME是主机名，因此须要集群中每一个节点的hosts文件包含其余节点主机名到地址的映射。可是若是设置为true，就能够定义RABBITMQ_NODENAME中的$HOSTNAME为域名了）
- RABBITMQ_DIST_PORT：集群端口号，默认RABBITMQ_NODE_PORT + 20000
$RABBITMQ_HOME/etc/rabbitmq/rabbitmq.config：
- cluster_nodes：设置后，在启动时会尝试自动链接加入的节点并组成集群。
- cluster_partition_handling：详见上文：网络分区的处理。

更多详细的配置见：配置

命令

rabbitmqctl stop_app
rabbitmqctl join_cluster [--ram] nodename@hostname：将当前节点加入到集群中；默认是以disc节点加入集群，加上--ram为ram节点。
rabbitmqctl start_app
rabbitmqctl cluster_status：查看集群状态

注：若是加入集群失败，可先查看

每一个节点的$HOME/.erlang.cookie内容一致；
若是hostname是主机名，那么此hostname和地址的映射须要加入hosts文件中；
若是使用的是域名，那么须要设置RABBITMQ_USE_LONGNAME为true。

注：docker版集群的见：rabbitmq-server-cluster

高级

AMQP协议简介

RabbitMQ原生支持AMQP 0-9-1并扩展实现了了一些经常使用的功能：AMQP 0-9-1

包含三层：

模型层: 最高层，提供了客户端调用的命令，如：queue.declare,basic.ack,consume等。
会话层：将命令从客户端传递给服务器，再将服务器的应答传递给客户端，会话层为这个传递过程提供可靠性、同步机制和错误处理。
传输层：主要传输二进制数据流，提供帧的处理、信道复用、错误检测和数据表示。

注：其余协议的支持见：RabbitMQ支持的协议

经常使用插件

管理界面（神器）

启动后，执行rabbitmq-plugins enable rabbitmq_management->
访问http://localhost:15672->查看节点状态，队列信息等等，甚至能够动态配置消息队列的主备策略，以下图：

<a name="federation"/> Federation

启用Federation插件，使得不一样集群的节点之间能够传递消息，从而模拟出相似集群的效果。这样能够有几点好处：

松耦合：联合在一块儿的不一样集群能够有各自的用户，权限等信息，无需一致；此外，这些集群的RabbitMQ和Erlang的版本能够不一致。
远程网络链接友好：因为通讯是遵循AMQP协议的，故而对断断续续的网络链接容忍度高。
自定义：能够自主选择哪些组件启用federation。

几个概念：

Upstreams: 定义上游节点信息，如：
```
rabbitmqctl set_parameter federation-upstream my-upstream '{"uri":"amqp://server-name","expires":3600000}'
```
定义一个my-upstream
- uri是其上游节点的地址，多个upstream的节点无需在同一集群中。
- expires表示断开链接3600000ms后其上游节点会缓存消息。
Upstream sets: 多个Upstream的集合；默认有个all，会将全部的Upstream加进去。
Policies: 定义哪些exchanges,queues关联到哪一个Upstream或者Upstream set，如：
```
rabbitmqctl set_policy --apply-to exchanges federate-me "^amq\." '{"federation-upstream-set":"all"}'
```
将此节点全部以amq.开头的exchange联合到上游节点的同名exchange。

注：

因为下游节点的exchange能够继续做为其余节点的上游，故可设置成循环，广播等形式。
经过max_hops参数控制传递层数。
模拟集群，能够将多个节点两两互连，并设置max_hops=1。

rabbitmq-plugins enable rabbitmq_federation

若是启用了管理界面，能够添加：

rabbitmq-plugins enable rabbitmq_federation_management

这样就能够在界面配置Upstream和Policy了。

注：若是在一个集群中使用federation，须要该集群每一个节点都启用Federation插件

注：更多插件请见：插件

原文做者来自 MaxLeap 团队_Service&Infra 成员：吕舜
原文连接：https://blog.maxleap.cn/archives/648