咱们能够把消息队列比做是一个存放消息的容器,当咱们须要使用消息的时候能够取出消息供本身使用。消息队列是分布式系统中重要的组件,使用消息队列主要是为了经过异步处理提升系统性能和削峰、下降系统耦合性。目前使用较多的消息队列有ActiveMQ,RabbitMQ,Kafka,RocketMQ,咱们后面会一一对比这些消息队列。java
另外,咱们知道队列 Queue 是一种先进先出的数据结构,因此消费消息时也是按照顺序来消费的。好比生产者发送消息1,2,3...对于消费者就会按照1,2,3...的顺序来消费。可是偶尔也会出现消息被消费的顺序不对的状况,好比某个消息消费失败又或者一个 queue 多个consumer 也会致使消息被消费的顺序不对,咱们必定要保证消息被消费的顺序正确。面试
除了上面说的消息消费顺序的问题,使用消息队列,咱们还要考虑如何保证消息不被重复消费?如何保证消息的可靠性传输(如何处理消息丢失的问题)?......等等问题。因此说使用消息队列也不是十全十美的,使用它也会让系统可用性下降、复杂度提升,另外须要咱们保障一致性等问题。算法
我以为使用消息队列主要有两点好处:1.经过异步处理提升系统性能(削峰、减小响应所需时间);2.下降系统耦合性。若是在面试的时候你被面试官问到这个问题的话,通常状况是你在你的简历上涉及到消息队列这方面的内容,这个时候推荐你结合你本身的项目来回答。数据库
《大型网站技术架构》第四章和第七章均有提到消息队列对应用性能及扩展性的提高。服务器
如上图,在不使用消息队列服务器的时候,用户的请求数据直接写入数据库,在高并发的状况下数据库压力剧增,使得响应速度变慢。可是在使用消息队列以后,用户的请求数据发送给消息队列以后当即 返回,再由消息队列的消费者进程从消息队列中获取数据,异步写入数据库。因为消息队列服务器处理速度快于数据库(消息队列也比数据库有更好的伸缩性),所以响应速度获得大幅改善。数据结构
经过以上分析咱们能够得出消息队列具备很好的削峰做用的功能——即经过异步处理,将短期高并发产生的事务消息存储在消息队列中,从而削平高峰期的并发事务。 举例:在电子商务一些秒杀、促销活动中,合理使用消息队列能够有效抵御促销活动刚开始大量订单涌入对系统的冲击。以下图所示: 架构
由于用户请求数据写入消息队列以后就当即返回给用户了,可是请求数据在后续的业务校验、写数据库等操做中可能失败。所以使用消息队列进行异步处理以后,须要适当修改业务流程进行配合,好比用户在提交订单以后,订单数据写入消息队列,不能当即返回用户订单提交成功,须要在消息队列的订单消费者进程真正处理完该订单以后,甚至出库后,再经过电子邮件或短信通知用户订单成功,以避免交易纠纷。这就相似咱们平时手机订火车票和电影票。并发
咱们知道若是模块之间不存在直接调用,那么新增模块或者修改模块就对其余模块影响较小,这样系统的可扩展性无疑更好一些。异步
咱们最多见的事件驱动架构相似生产者消费者模式,在大型网站中一般用利用消息队列实现事件驱动结构。以下图所示:分布式
消息队列使利用发布-订阅模式工做,消息发送者(生产者)发布消息,一个或多个消息接受者(消费者)订阅消息。
从上图能够看到消息发送者(生产者)和消息接受者(消费者)之间没有直接耦合,消息发送者将消息发送至分布式消息队列即结束对消息的处理,消息接受者从分布式消息队列获取该消息后进行后续处理,并不须要知道该消息从何而来。对新增业务,只要对该类消息感兴趣,便可订阅该消息,对原有系统和业务没有任何影响,从而实现网站业务的可扩展性设计。
消息接受者对消息进行过滤、处理、包装后,构形成一个新的消息类型,将消息继续发送出去,等待其余消息接受者订阅该消息。所以基于事件(消息对象)驱动的业务架构能够是一系列流程。
另外为了不消息队列服务器宕机形成消息丢失,会将成功发送到消息队列的消息存储在消息生产者服务器上,等消息真正被消费者服务器处理后才删除消息。在消息队列服务器宕机后,生产者服务器会选择分布式消息队列服务器集群中的其余服务器发布消息。
备注: 不要认为消息队列只能利用发布-订阅模式工做,只不过在解耦这个特定业务环境下是使用发布-订阅模式的。除了发布-订阅模式,还有点对点订阅模式(一个消息只有一个消费者),咱们比较经常使用的是发布-订阅模式。 另外,这两种消息模型是 JMS 提供的,AMQP 协议还提供了 5 种消息模型。
JMS(JAVA Message Service,java消息服务)是java的消息服务,JMS的客户端之间能够经过JMS服务进行异步的消息传输。JMS(JAVA Message Service,Java消息服务)API是一个消息服务的标准或者说是规范,容许应用程序组件基于JavaEE平台建立、发送、接收和读取消息。它使分布式通讯耦合度更低,消息服务更加可靠以及异步性。
ActiveMQ 就是基于 JMS 规范实现的。
①点到点(P2P)模型
为消息通讯载体;知足生产者与消费者模式,一条消息只能被一个消费者使用,未被消费的消息在队列中保留直到被消费或超时。好比:咱们生产者发送100条消息的话,两个消费者来消费通常状况下两个消费者会按照消息发送的顺序各自消费一半(也就是你一个我一个的消费。)
② 发布/订阅(Pub/Sub)模型
发布订阅模型(Pub/Sub) 使用主题(Topic)做为消息通讯载体,相似于广播模式;发布者发布一条消息,该消息经过主题传递给全部的订阅者,在一条消息广播以后才订阅的用户则是收不到该条消息的。
JMS定义了五种不一样的消息正文格式,以及调用的消息类型,容许你发送并接收以一些不一样形式的数据,提供现有消息格式的一些级别的兼容性。
AMQP,即Advanced Message Queuing Protocol,一个提供统一消息服务的应用层标准 高级消息队列协议(二进制应用层协议),是应用层协议的一个开放标准,为面向消息的中间件设计,兼容 JMS。基于此协议的客户端与消息中间件可传递消息,并不受客户端/中间件同产品,不一样的开发语言等条件的限制。
RabbitMQ 就是基于 AMQP 协议实现的。
对比方向 | JMS | AMQP |
---|---|---|
定义 | Java API | 协议 |
跨语言 | 否 | 是 |
跨平台 | 否 | 是 |
支持消息类型 | 提供两种消息模型:①Peer-2-Peer;②Pub/sub | 提供了五种消息模型:①direct exchange;②fanout exchange;③topic change;④headers exchange;⑤system exchange。本质来说,后四种和JMS的pub/sub模型没有太大差异,仅是在路由机制上作了更详细的划分; |
支持消息类型 | 支持多种消息类型 ,咱们在上面提到过 | byte[](二进制) |
总结:
对比方向 | 概要 |
---|---|
吞吐量 | 万级的 ActiveMQ 和 RabbitMQ 的吞吐量(ActiveMQ 的性能最差)要比 十万级甚至是百万级的 RocketMQ 和 Kafka 低一个数量级。 |
可用性 | 均可以实现高可用。ActiveMQ 和 RabbitMQ 都是基于主从架构实现高可用性。RocketMQ 基于分布式架构。 kafka 也是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会致使不可用 |
时效性 | RabbitMQ 基于erlang开发,因此并发能力很强,性能极其好,延时很低,达到微秒级。其余三个都是 ms 级。 |
功能支持 | 除了 Kafka,其余三个功能都较为完备。 Kafka 功能较为简单,主要支持简单的MQ功能,在大数据领域的实时计算以及日志采集被大规模使用,是事实上的标准 |
消息丢失 | ActiveMQ 和 RabbitMQ 丢失的可能性很是低, RocketMQ 和 Kafka 理论上不会丢失。 |
总结: