因为以前作的项目中须要在多个节点之间可靠地通讯,因此废弃了以前使用的Redis pub/sub(由于集群有单点问题,且有诸多限制),改用了RabbitMQ。
使用期间获得很多收获,也踩了很多坑,因此在此分享下心得。(简单了解下RabbitMQ? 详见下文:简介)html
RabbitMQ提供了几种特性,牺牲了一点性能代价,提供了可靠性的保证。java
1. 持久化 node
当RabbitMQ退出时,默认会将消息和队列都清除,因此须要在第一次声明队列和发送消息时指定其持久化属性为true,这样RabbitMQ会将队列、消息和状态存到RabbitMQ本地的数据库,重启后会恢复。 git
java:github
durable=true channel.queueDeclare("task_queue", durable, false, false, null); // 队列 channel.basicPublish("", "task_queue", MessageProperties.PERSISTENT_TEXT_PLAIN, message.getBytes()); // 消息
注:当声明的队列已经存在时,尝试从新定义它的durable是不生效的。docker
2. 接收应答 数据库
客户端接收消息的模式默认是自动应答,可是经过设置autoAck为false可让客户端主动应答消息。当客户端拒绝此消息或者未应答便断开链接时,就会使得此消息从新入队(在版本2.7.0之前是到从新加入到队尾,2.7.0及之后是保留消息在队列中的原来位置)。 缓存
java:服务器
autoAck = false; requeue = true; channel.basicConsume(queue, autoAck, callback); channel.basicAck();//应答 channel.basicReject(deliveryTag, requeue); // 拒绝 channel.basicRecover(requeue); // 恢复
3. 发送确认 cookie
默认状况下,发送端不关注发出去的消息是否被消费掉了。可设置channel为confirm模式,全部发送的消息都会被确认一次,用户能够自行根据server发回的确认消息查看状态。详细介绍见:confirms
java:
channel.confirmSelect(); // 进入confirm模式 // do publish messages... 每条消息都会被编号,从1开始 channel.getNextPublishSeqNo() // 查看下一条要发送的消息的序号 channel.waitForConfirms(); // 等待全部消息发送并确认
4. 事务
和confirm模式不能同时使用,并且会带来大量的多余开销,致使吞吐量降低不少,故而不推荐。
java:
channel.txSelect(); try { // do something... channel.txCommit(); } catch (e){ channel.txRollback(); }
5. <a name="ha" />
消息队列的高可用(主备模式)
相比于路由和绑定,能够视为是共享于全部的节点的,消息队列默认只存在于第一次声明它的节点上,这样一旦这个节点挂了,这个队列中未处理的消息就没有了。
幸亏,RabbitMQ提供了将它备份到其余节点的机制,任什么时候候都有一个master负责处理请求,其余slaves负责备份,当master挂掉,会将最先建立的那个slave提高为master。
命令:
rabbitmqctl set_policy ha-all "^ha\." '{"ha-mode":"all"}'
设置全部以'ha'开头的queue在全部节点上拥有备份。详细语法点这里,也能够在界面上配置。
注:因为exclusive类型的队列会在client和server链接断开时被删掉,因此对它设置持久化属性和备份都是没有意义的。
6. 顺序保证
直接上图好了:
1. 集群配置
一个集群中多个节点共享一份.erlang.cookie文件;如果没有启用RABBITMQ_USE_LONGNAME,须要在每一个节点的hosts文件中指定其余节点的地址,否则会找不到其余集群中的节点。
2. 脑裂(网络分区)
RabbitMQ集群对于网络分区的处理和忍受能力不太好,推荐使用federation或者shovel插件去解决。federation详见高级->Federation
可是,状况已经发生了,怎么去解决呢?放心,仍是有办法恢复的。
当网络断断续续时,会使得节点之间的通讯断掉,进而形成集群被分隔开的状况。
这样,每一个小集群以后便只处理各自本地的链接和消息,从而致使数据不一样步。当从新恢复网络链接时,它们彼此都认为是对方挂了-_-||,即可以判断出有网络分区出现了。可是RabbitMQ默认是忽略掉不处理的,形成两个节点继续各自为政(路由,绑定关系,队列等能够独立地建立删除,甚至主备队列也会每一方拥有本身的master)。
能够更改配置使得链接恢复时,会根据配置自动恢复:
ignore:默认,不作任何处理
pause-minority:断开链接时,判断当前节点是否属于少数派(节点数少于或者等于一半),若是是,则暂停直到恢复链接。
{pause_if_all_down, [nodes], ignore | autoheal}:断开链接时,判断当前集群中节点是否有节点在nodes中,若是有,则继续运行,不然暂停直到恢复链接。这种策略下,当恢复链接时,可能会有多个分区存活,因此,最后一个参数决定它们怎么合并。
autoheal:当恢复链接时,选择客户端链接数最多的节点状态为主,重启其余节点。
配置:集群配置
3. 屡次ack
客户端屡次应答同一条消息,会使得该客户端收不到后续消息。
集群版本的实现:详见我本身写的一个例子rabbitmq-server-cluster
RabbitMQ
优势:支持不少协议如:AMQP,XMPP,STMP,STOMP;灵活的路由;成熟稳定的集群方案;负载均衡;数据持久化等。
缺点:速度较慢;比较重量级,安装须要依赖Erlang环境。
Redis
优势:比较轻量级,易上手
缺点:单点问题,功能单一
Kafka:
优势:高吞吐;分布式;快速持久化;负载均衡;轻量级
缺点:极端状况下会丢消息
最后附一张网上截取的测试结果:
更多性能参数见:http://www.rabbitmq.com/blog/2012/04/25/rabbitmq-performance-measurements-part-2/
若是有兴趣简单了解下RabbitMQ的简单介绍,能够继续往下看~
几个重要的概念:
Virtual Host 包含若干个Exchange和Queue,表示一个节点;
Exchange 接受客户端发送的消息,并根据Binding将消息路由给服务器中的队列,Exchange分为direct, fanout, topic三种。
Binding 链接Exchange和Queue,包含路由规则。
Queue 消息队列,存储还未被消费的消息。
Message Header+Body
Channel 通道,执行AMQP的命令;一个链接可建立多个通道以节省资源。
RabbitMQ官方实现了不少热门语言的客户端,就不一一列举啦,以java为例,直接开始正题:
1. 创建链接
ConnectionFactory factory = new ConnectionFactory(); factory.setHost("localhost");
能够加上断开重试机制:
factory.setAutomaticRecoveryEnabled(true); factory.setNetworkRecoveryInterval(10000);
建立链接和通道:
Connection connection = factory.newConnection(); Channel channel = connection.createChannel();
2. 一对一:一个生产者,一个消费者
生产者:
channel.queueDeclare(QUEUE_NAME, false, false, false, null); channel.basicPublish("", QUEUE_NAME, null, message.getBytes());
消费者:
Consumer consumer = new DefaultConsumer(channel) { @Override public void handleDelivery(String consumerTag, Envelope envelope, AMQP.BasicProperties properties, byte[] body) throws IOException { String message = new String(body, "UTF-8"); System.out.println(" [x] Received '" + message + "'"); } }; channel.basicConsume(QUEUE_NAME, autoAck, consumer);
3. 一对多:一个生产者,多个消费者
代码同上,只不过会有多个消费者,消息会轮序发给各个消费者。
若是设置了autoAck=false,那么能够实现公平分发(即对于某个特定的消费者,每次最多只发送指定条数的消息,直到其中一条消息应答后,再发送下一条)。须要在消费者中加上:
int prefetchCount = 1; channel.basicQos(prefetchCount);
其余同上。
4. 广播
生产者:
channel.exchangeDeclare(EXCHANGE_NAME, "fanout"); String queueName = channel.queueDeclare().getQueue(); channel.queueBind(queueName, EXCHANGE_NAME, ""); channel.basicPublish(EXCHANGE_NAME, "", null, message.getBytes());
消费者同上。
5. Routing:指定路由规则
生产者:
String queueName = channel.queueDeclare().getQueue(); channel.queueBind(queueName, EXCHANGE_NAME, routingKey); channel.basicPublish(EXCHANGE_NAME, routingKey, null, message.getBytes());
消费者同上。
6. Topics:支持通配符的Routing
* 能够表示一个单词
# 能够表示一个或多个单词
生产者:
channel.exchangeDeclare(EXCHANGE_NAME, "topic"); String queueName = channel.queueDeclare().getQueue(); channel.queueBind(queueName, EXCHANGE_NAME, bindingKey);
消费者同上。
7. RPC
其实就是一对一模式的一种用法:
首先,客户端发送一条消息到服务端声明的队列,消息属性中包含reply_to和correlation_id
reply_to 是客户端建立的消息的队列,用来接收远程调用结果
correlation_id 是消息的标识,服务端回应的消息属性中会带上以便知道是哪条消息的结果。
而后,服务端接收到消息,处理,并返回一条结果到reply_to队列中,
最终,客户端接收到返回消息,继续向下处理。
支持各大主流操做系统,这里以Unix为例介绍下经常使用配置和命令:
安装:
因为RabbitMQ是依赖于Erlang的,因此得首先安装最近版本的Erlang。
单点的安装比较简单,下载解压便可。下载地址
配置:(通常的,用默认的便可)
$RABBITMQ_HOME/etc/rabbitmq/rabbitmq-env.conf: 环境变量默认配置(也可在启动脚本中设置,且以启动命令中的配置为准)。经常使用的有:
RABBITMQ_NODENAME:节点名称,默认是rabbit@$HOSTNAME。
RABBITMQ_NODE_PORT:协议端口号,默认5672。
RABBITMQ_SERVER_START_ARGS:覆盖rabbitmq.config中的一些配置。
$RABBITMQ_HOME/etc/rabbitmq/rabbitmq.config: 核心组件,插件,erlang服务等配置,经常使用的有:
disk_free_limit:队列持久化等信息都是存到RabbitMQ本地的数据库中的,默认限制50000000(也就是最多只让它使用50M空间啦,不够能够上调,也支持空闲空间百分比的配置)。要是超标了,它就罢工了……
vm_memory_high_watermark:内存使用,默认0.4(最多让它使用40%的内存,超标罢工)
注:若启动失败了,能够在启动日志中查看到具体的错误信息。
命令:
$RABBITMQ_HOME/sbin/rabbitmq-server
:启动脚本,会打印出配置文件,插件,集群等信息;加上-detached为后台启动;
/sbin/rabbitmqctl status
:查看启动状态
/sbin/rabbitmqctl add_user admin admin
:添加新用户admin,密码admin;默认只有一个guest用户,但只限本机访问。
/sbin/rabbitmqctl set_user_tags admin administrator
:将admin设置为管理员权限
/sbin/rabbitmqctl set_permissions -p / admin ".*" ".*" ".*"
赋予admin全部权限
/sbin/rabbitmqctl stop
:关闭
集群节点共享全部的状态和数据,如:用户、路由、绑定等信息(队列有点特殊,虽然从全部节点均可达,可是只存在于第一次声明它的那个节点上,解决方案:详见上文:消息队列的高可用;每一个节点均可以接收链接,处理数据。
集群节点有两种,disc:默认,信息存在本地数据库;ram:加入集群时,添加--ram参数,信息存在内存,可提升性能。
配置:(通常的,用默认的便可。)
$RABBITMQ_HOME/etc/rabbitmq/rabbitmq-env.conf:
RABBITMQ_USE_LONGNAME:默认false,(默认的,RABBITMQ_NODENAME中@后面的$HOSTNAME是主机名,因此须要集群中每一个节点的hosts文件包含其余节点主机名到地址的映射。可是若是设置为true,就能够定义RABBITMQ_NODENAME中的$HOSTNAME为域名了)
RABBITMQ_DIST_PORT:集群端口号,默认RABBITMQ_NODE_PORT + 20000
$RABBITMQ_HOME/etc/rabbitmq/rabbitmq.config:
cluster_nodes:设置后,在启动时会尝试自动链接加入的节点并组成集群。
cluster_partition_handling:详见上文:网络分区的处理。
更多详细的配置见:配置
命令
rabbitmqctl stop_app
rabbitmqctl join_cluster [--ram] nodename@hostname
:将当前节点加入到集群中;默认是以disc节点加入集群,加上--ram为ram节点。
rabbitmqctl start_app
rabbitmqctl cluster_status
:查看集群状态
注:若是加入集群失败,可先查看
每一个节点的$HOME/.erlang.cookie内容一致;
若是hostname是主机名,那么此hostname和地址的映射须要加入hosts文件中;
若是使用的是域名,那么须要设置RABBITMQ_USE_LONGNAME为true。
注:docker版集群的见:rabbitmq-server-cluster
AMQP协议简介
RabbitMQ原生支持AMQP 0-9-1并扩展实现了了一些经常使用的功能:AMQP 0-9-1
包含三层:
模型层: 最高层,提供了客户端调用的命令,如:queue.declare,basic.ack,consume等。
会话层:将命令从客户端传递给服务器,再将服务器的应答传递给客户端,会话层为这个传递过程提供可靠性、同步机制和错误处理。
传输层:主要传输二进制数据流,提供帧的处理、信道复用、错误检测和数据表示。
注:其余协议的支持见:RabbitMQ支持的协议
管理界面(神器)
启动后,执行rabbitmq-plugins enable rabbitmq_management
->
访问http://localhost:15672->查看节点状态,队列信息等等,甚至能够动态配置消息队列的主备策略,以下图:
<a name="federation"/> Federation
启用Federation插件,使得不一样集群的节点之间能够传递消息,从而模拟出相似集群的效果。这样能够有几点好处:
松耦合:联合在一块儿的不一样集群能够有各自的用户,权限等信息,无需一致;此外,这些集群的RabbitMQ和Erlang的版本能够不一致。
远程网络链接友好:因为通讯是遵循AMQP协议的,故而对断断续续的网络链接容忍度高。
自定义:能够自主选择哪些组件启用federation。
几个概念:
Upstreams: 定义上游节点信息,如:
rabbitmqctl set_parameter federation-upstream my-upstream '{"uri":"amqp://server-name","expires":3600000}'
定义一个my-upstream
uri是其上游节点的地址,多个upstream的节点无需在同一集群中。
expires表示断开链接3600000ms后其上游节点会缓存消息。
Upstream sets: 多个Upstream的集合;默认有个all
,会将全部的Upstream加进去。
Policies: 定义哪些exchanges,queues关联到哪一个Upstream或者Upstream set,如:
rabbitmqctl set_policy --apply-to exchanges federate-me "^amq\." '{"federation-upstream-set":"all"}'
将此节点全部以amq.开头的exchange联合到上游节点的同名exchange。
注:
因为下游节点的exchange能够继续做为其余节点的上游,故可设置成循环,广播等形式。
经过max_hops参数控制传递层数。
模拟集群,能够将多个节点两两互连,并设置max_hops=1。
rabbitmq-plugins enable rabbitmq_federation
若是启用了管理界面,能够添加:
rabbitmq-plugins enable rabbitmq_federation_management
这样就能够在界面配置Upstream和Policy了。
注:若是在一个集群中使用federation,须要该集群每一个节点都启用Federation插件
注:更多插件请见:插件
原文做者来自 MaxLeap 团队_Service&Infra 成员:吕舜
原文连接:https://blog.maxleap.cn/archives/648