消息中间件介绍(非原创）

时间 2019-11-11

标签消息中间件介绍原创繁體版

原文原文链接

文章大纲

1、什么是消息中间件
2、消息中间件组成
3、消息队列的的传输模式
4、消息中间件的优点
5、消息中间件应用场景
6、消息中间件经常使用协议
7、常见消息中间件介绍与比较
8、参考文章html

1、什么是消息中间件

消息队列已经逐渐成为企业IT系统内部通讯的核心手段。它具备低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能，成为异步RPC的主要手段之一。当今市面上有不少主流的消息中间件，如老牌的ActiveMQ、RabbitMQ，煊赫一时的Kafka，阿里巴巴自主开发RocketMQ等。前端

2、消息中间件组成

1. Broker

消息服务器，为server提供消息核心服务git

2. Producer

消息生产者，业务的发起方，负责生产消息传输给brokerredis

3. Consumer

消息消费者，业务的处理方，负责从broker获取消息并进行业务逻辑处理数据库

4. Topic

主题，发布订阅模式下的消息统一聚集地，不一样生产者向topic发送消息，由MQ服务器分发到不一样的订阅者，实现消息的广播编程

5. Queue

队列，PTP模式下，特定生产者向特定queue发送消息，消费者订阅特定的queue完成指定消息的接收浏览器

6. Message

消息体，根据不一样通讯协议定义的固定格式进行编码的数据包，来封装业务数据，实现消息的传输安全

3、消息队列的的传输模式

1. 点对点

点对点模型用于消息生产者和消息消费者之间点到点的通讯。消息生产者将消息发送到由某个名字标识的特定消费者。这个名字实际上对于消费服务中的一个队列（Queue），在消息传递给消费者以前它被存储在这个队列中。队列消息能够放在内存中也能够持久化，以保证在消息服务出现故障时仍然可以传递消息。服务器

传统的点对点消息中间件一般由消息队列服务、消息传递服务、消息队列和消息应用程序接口 API 组成，其典型的结构以下图所示。网络

特色
每一个消息只用一个消费者；
发送者和接受者没有时间依赖；
接受者确认消息接受和处理成功。

示意图以下所示

2. 发布/订阅模型（Pub/Sub）

发布者/订阅者模型支持向一个特定的消息主题生产消息。0 或多个订阅者可能对接收来自特定消息主题的消息感兴趣。

在这种模型下，发布者和订阅者彼此不知道对方，就比如是匿名公告板。这种模式被概况为：多个消费者能够得到消息，在发布者和订阅者之间存在时间依赖性。发布者须要创建一个订阅（subscription），以便可以消费者订阅。订阅者必须保持持续的活动状态并接收消息。

在这种状况下，在订阅者未链接时，发布的消息将在订阅者从新链接时从新发布，以下图所示：

特性
每一个消息能够有多个订阅者；
客户端只有订阅后才能接收到消息；
持久订阅和非持久订阅。

注意
发布者和订阅者有时间依赖：接受者和发布者只有创建订阅关系才能收到消息；
持久订阅：订阅关系创建后，消息就不会消失，无论订阅者是否都在线；
非持久订阅：订阅者为了接受消息，必须一直在线。当只有一个订阅者时约等于点对点模式

4、消息中间件的优点

1. 系统解耦

交互系统之间没有直接的调用关系，只是经过消息传输，故系统侵入性不强，耦合度低。

2. 提升系统响应时间

例如原来的一套逻辑，完成支付可能涉及先修改订单状态、计算会员积分、通知物流配送几个逻辑才能完成；经过MQ架构设计，就可将紧急重要（须要马上响应）的业务放到该调用方法中，响应要求不高的使用消息队列，放到MQ队列中，供消费者处理。

3. 为大数据处理架构提供服务

经过消息做为整合，大数据的背景下，消息队列还与实时处理架构整合，为数据处理提供性能支持。

4. Java消息服务——JMS

Java消息服务（Java Message Service，JMS）应用程序接口是一个Java平台中关于面向消息中间件（MOM）的API，用于在两个应用程序之间，或分布式系统中发送消息，进行异步通讯。
JMS中的P2P和Pub/Sub消息模式：点对点（point to point， queue）与发布订阅（publish/subscribe，topic）最初是由JMS定义的。这两种模式主要区别或解决的问题就是发送到队列的消息可否重复消费(多订阅)。

5、消息中间件应用场景

当你须要使用消息队列时，首先须要考虑它的必要性。可使用消息队列的场景有不少，最经常使用的几种，是作应用程序松耦合、异步处理模式、发布与订阅、最终一致性、错峰流控和日志缓冲等。反之，若是须要强一致性，关注业务逻辑的处理结果，则使用 RPC 显得更为合适。

1. 异步处理

1.1 介绍
有些业务不想也不须要当即处理消息。消息队列提供了异步处理机制，容许用户把一个消息放入队列，但并不当即处理它。想向队列中放入多少消息就放多少，而后在须要的时候再去处理它们。

1.2 具体场景
用户为了使用某个应用，进行注册，系统须要发送注册邮件并验证短信。对这两个操做的处理方式有两种：串行及并行。
（1）串行方式：新注册信息生成后，先发送注册邮件，再发送验证短信；

在这种方式下，须要最终发送验证短信后再返回给客户端。

（2）并行处理：新注册信息写入后，由发短信和发邮件并行处理；

在这种方式下，发短信和发邮件需处理完成后再返回给客户端。

假设以上三个子系统处理的时间均为50ms，且不考虑网络延迟，则总的处理时间：

串行：50+50+50=150ms 并行：50+50 = 100ms

若使用消息队列：

并在写入消息队列后当即返回成功给客户端，则总的响应时间依赖于写入消息队列的时间，而写入消息队列的时间自己是能够很快的，基本能够忽略不计，所以总的处理时间相比串行提升了2倍，相比并行提升了一倍；

2. 应用耦合

2.1 介绍
交互系统之间没有直接的调用关系，只是经过消息传输，故系统侵入性不强，耦合度低。

2.2 具体场景
用户使用QQ相册上传一张图片，人脸识别系统会对该图片进行人脸识别，通常的作法是，服务器接收到图片后，图片上传系统当即调用人脸识别系统，调用完成后再返回成功，以下图所示：

该方法有以下缺点：
（1）人脸识别系统被调失败，致使图片上传失败；
（2）延迟高，须要人脸识别系统处理完成后，再返回给客户端，即便用户并不须要当即知道结果；
（3）图片上传系统与人脸识别系统之间互相调用，须要作耦合；

若使用消息队列：

客户端上传图片后，图片上传系统将图片信息如uin、批次写入消息队列，直接返回成功；而人脸识别系统则定时从消息队列中取数据，完成对新增图片的识别。

此时图片上传系统并不须要关心人脸识别系统是否对这些图片信息的处理、以及什么时候对这些图片信息进行处理。事实上，因为用户并不须要当即知道人脸识别结果，人脸识别系统能够选择不一样的调度策略，按照闲时、忙时、正常时间，对队列中的图片信息进行处理。

3. 流量削峰和流控

3.1 介绍
当上下游系统处理能力存在差距的时候，利用消息队列作一个通用的 “漏斗”，进行限流控制。在下游有能力处理的时候，再进行分发。

3.2 具体场景
用户在支付系统成功结帐后，订单系统会经过短信系统向用户推送扣费通知。短信系统可能因为短板效应，速度卡在网关上（每秒几百次请求），跟前端的并发量不是一个数量级。因而，就形成支付系统和短信系统的处理能力出现差别化。

然而用户晚上个半分钟左右收到短信，通常是不会有太大问题的。若是没有消息队列，两个系统之间经过协商、滑动窗口等复杂的方案也不是说不能实现。但系统复杂性指数级增加，势必在上游或者下游作存储，而且要处理定时、拥塞等一系列问题。并且每当有处理能力有差距的时候，都须要单独开发一套逻辑来维护这套逻辑。

因此，利用中间系统转储两个系统的通讯内容，并在下游系统有能力处理这些消息的时候，再处理这些消息，是一套相对较通用的方式。

应用案例
（1）把消息队列当成可靠的消息暂存地，进行必定程度的消息堆积；
（2）定时进行消息投递，好比模拟用户秒杀访问，进行系统性能压测。

4. 消息驱动的系统

具体场景
用户新上传了一批照片，人脸识别系统须要对这个用户的全部照片进行聚类，聚类完成后由对帐系统从新生成用户的人脸索引(加快查询)。这三个子系统间由消息队列链接起来，前一个阶段的处理结果放入队列中，后一个阶段从队列中获取消息继续处理。

该方法有以下优势：
（1）避免了直接调用下一个系统致使当前系统失败；
（2）每一个子系统对于消息的处理方式能够更为灵活，能够选择收到消息时就处理，能够选择定时处理，也能够划分时间段按不一样处理速度处理；

5. 日志处理

将消息队列用在日志处理中，好比 Kafka 的应用，解决海量日志传输和缓冲的问题。
应用案例
把日志进行集中收集，用于计算 PV、用户行为分析等等。

6. 顺序保证

在大多使用场景下，数据处理的顺序都很重要。大部分消息队列原本就是排序的，而且能保证数据会按照特定的顺序来处理。

7. 消息通信

消息队列通常都内置了高效的通讯机制，所以也能够用于单纯的消息通信，好比实现点对点消息队列或者聊天室等。

6、消息中间件经常使用协议

1. AMQP协议

AMQP即Advanced Message Queuing Protocol,一个提供统一消息服务的应用层标准高级消息队列协议,是应用层协议的一个开放标准,为面向消息的中间件设计。基于此协议的客户端与消息中间件可传递消息，并不受客户端/中间件不一样产品，不一样开发语言等条件的限制。
优势：可靠、通用

2. MQTT协议

MQTT（Message Queuing Telemetry Transport，消息队列遥测传输）是IBM开发的一个即时通信协议，有可能成为物联网的重要组成部分。该协议支持全部平台，几乎能够把全部联网物品和外部链接起来，被用来当作传感器和致动器（好比经过Twitter让房屋联网）的通讯协议。
优势：格式简洁、占用带宽小、移动端通讯、PUSH、嵌入式系统

3. STOMP协议

STOMP（Streaming Text Orientated Message Protocol）是流文本定向消息协议，是一种为MOM(Message Oriented Middleware，面向消息的中间件)设计的简单文本协议。STOMP提供一个可互操做的链接格式，容许客户端与任意STOMP消息代理（Broker）进行交互。
优势：命令模式（非topic\queue模式）

4. XMPP协议

XMPP（可扩展消息处理现场协议，Extensible Messaging and Presence Protocol）是基于可扩展标记语言（XML）的协议，多用于即时消息（IM）以及在线现场探测。适用于服务器之间的准即时操做。核心是基于XML流传输，这个协议可能最终容许因特网用户向因特网上的其余任何人发送即时消息，即便其操做系统和浏览器不一样。
优势：通用公开、兼容性强、可扩展、安全性高，但XML编码格式占用带宽大

5. 其余基于TCP/IP自定义的协议

有些特殊框架（如：redis、kafka、zeroMq等）根据自身须要未严格遵循MQ规范，而是基于TCP\IP自行封装了一套协议，经过网络socket接口进行传输，实现了MQ的功能。

7、常见消息中间件介绍与比较

1. 中间件介绍

1.1 ActiveMQ
简介
ActiveMQ 是由 Apache 出品，ActiveMQ 是一个彻底支持JMS1.1 和 J2EE 1.4 规范的 JMS Provider 实现。它很是快速，支持多种语言的客户端和协议，并且能够很是容易的嵌入到企业的应用环境中，并有许多高级功能。

主要特性
（1）服从JMS规范：JMS 规范提供了良好的标准和保证，包括：同步或异步的消息分发，一次和仅一次的消息分发，消息接收和订阅等等。听从 JMS 规范的好处在于，不论使用什么 JMS 实现提供者，这些基础特性都是可用的；
（2）链接灵活性：ActiveMQ 提供了普遍的链接协议，支持的协议有：HTTP/S，IP 多播，SSL，TCP，UDP 等等。对众多协议的支持让 ActiveMQ 拥有了很好的灵活性；
（3）支持的协议种类多：OpenWire、STOMP、REST、XMPP、AMQP；
（4）持久化插件和安全插件：ActiveMQ 提供了多种持久化选择。并且，ActiveMQ 的安全性也能够彻底依据用户需求进行自定义鉴权和受权；
（5）支持的客户端语言种类多：除了 Java 以外，还有：C/C++，.NET，Perl，PHP，Python，Ruby；
（6）代理集群：多个 ActiveMQ 代理能够组成一个集群来提供服务；
（7）异常简单的管理：ActiveMQ 是以开发者思惟被设计的。因此，它并不须要专门的管理员，由于它提供了简单又使用的管理特性。有不少中方法能够监控 ActiveMQ 不一样层面的数据，包括使用在 JConsole 或者在 ActiveMQ 的 Web Console 中使用 JMX。经过处理 JMX 的告警消息，经过使用命令行脚本，甚至能够经过监控各类类型的日志。

部署环境
ActiveMQ 能够运行在 Java 语言所支持的平台之上。使用 ActiveMQ 须要：
（1）Java JDK
（2）ActiveMQ 安装包

优势
（1）跨平台 (JAVA 编写与平台无关，ActiveMQ 几乎能够运行在任何的 JVM 上)；
（2）能够用 JDBC：能够将数据持久化到数据库。虽然使用 JDBC 会下降 ActiveMQ 的性能，可是数据库一直都是开发人员最熟悉的存储介质；
（3）支持 JMS 规范：支持 JMS 规范提供的统一接口;
（4）支持自动重连和错误重试机制；
（5）有安全机制：支持基于 shiro，jaas 等多种安全配置机制，能够对 Queue/Topic 进行认证和受权；
（6）监控完善：拥有完善的监控，包括 Web Console，JMX，Shell 命令行，Jolokia 的 RESTful API；
9）7界面友善：提供的 Web Console 能够知足大部分状况，还有不少第三方的组件可使用，好比 hawtio；

缺点
（1）社区活跃度不及 RabbitMQ 高；
（2）根据其余用户反馈，会出莫名其妙的问题，会丢失消息；
（3）目前重心放到 activemq 6.0 产品 Apollo，对 5.x 的维护较少；
（4）不适合用于上千个队列的应用场景；

1.2 RabbitMQ
RabbitMQ 于 2007 年发布，是一个在 AMQP (高级消息队列协议)基础上完成的，可复用的企业消息系统，是当前最主流的消息中间件之一。

主要特性
（1）可靠性：提供了多种技术可让你在性能和可靠性之间进行权衡。这些技术包括持久性机制、投递确认、发布者证明和高可用性机制；
（2）灵活的路由：消息在到达队列前是经过交换机进行路由的。RabbitMQ 为典型的路由逻辑提供了多种内置交换机类型。若是你有更复杂的路由需求，能够将这些交换机组合起来使用，你甚至能够实现本身的交换机类型，而且当作 RabbitMQ 的插件来使用；
（3）消息集群：在相同局域网中的多个 RabbitMQ 服务器能够聚合在一块儿，做为一个独立的逻辑代理来使用；
（4）队列高可用：队列能够在集群中的机器上进行镜像，以确保在硬件问题下还保证消息安全；
（5）支持多种协议：支持多种消息队列协议；
（6）支持多种语言：用 Erlang 语言编写，支持只要是你能想到的全部编程语言；
（7）管理界面： RabbitMQ 有一个易用的用户界面，使得用户能够监控和管理消息 Broker 的许多方面；
（8）跟踪机制：若是消息异常，RabbitMQ 提供消息跟踪机制，使用者能够找出发生了什么；
（9）插件机制：提供了许多插件，来从多方面进行扩展，也能够编写本身的插件。

部署环境
RabbitMQ 能够运行在 Erlang 语言所支持的平台之上，包括 Solaris，BSD，Linux，MacOSX，TRU64，Windows 等。使用 RabbitMQ 须要：
（1）ErLang 语言包
（2）RabbitMQ 安装包

优势
（1）因为 Erlang 语言的特性，消息队列性能较好，支持高并发；
（2）健壮、稳定、易用、跨平台、支持多种语言、文档齐全；
（3）有消息确认机制和持久化机制，可靠性高；
（4）高度可定制的路由；
（5）管理界面较丰富，在互联网公司也有较大规模的应用，社区活跃度高。

缺点
（1）尽管结合 Erlang 语言自己的并发优点，性能较好，可是不利于作二次开发和维护；
（2）实现了代理架构，意味着消息在发送到客户端以前能够在中央节点上排队。此特性使得 RabbitMQ 易于使用和部署，可是使得其运行速度较慢，由于中央节点增长了延迟，消息封装后也比较大；
（3）须要学习比较复杂的接口和协议，学习和维护成本较高。

1.3 RocketMQ
简介
RocketMQ 出自阿里的开源产品，用 Java 语言实现，在设计时参考了 Kafka，并作出了本身的一些改进，消息可靠性上比 Kafka 更好。RocketMQ 在阿里内部被普遍应用在订单，交易，充值，流计算，消息推送，日志流式处理，binglog 分发等场景。

主要特性

（1）基于队列模型：具备高性能、高可靠、高实时、分布式等特色；
（2）Producer、Consumer、队列都支持分布式；
（3）Producer 向一些队列轮流发送消息，队列集合称为 Topic。Consumer 若是作广播消费，则一个 Consumer 实例消费这个 Topic 对应的全部队列；若是作集群消费，则多个 Consumer 实例平均消费这个 Topic 对应的队列集合；
（4）可以保证严格的消息顺序；
（5）提供丰富的消息拉取模式；
（6）高效的订阅者水平扩展能力；
（7）实时的消息订阅机制；
（8）亿级消息堆积能力；
（9）较少的外部依赖。

部署环境
RocketMQ 能够运行在 Java 语言所支持的平台之上。使用 RocketMQ 须要：
（1）Java JDK
（2）安装 git、Maven
（3）RocketMQ 安装包

优势
（1）单机支持 1 万以上持久化队列；
（2）RocketMQ 的全部消息都是持久化的，先写入系统 PAGECACHE，而后刷盘，能够保证内存与磁盘都有一份数据，而访问时，直接从内存读取。
（3）模型简单，接口易用（JMS 的接口不少场合并不太实用）；
（4）性能很是好，能够容许大量堆积消息在 Broker 中；
（5）支持多种消费模式，包括集群消费、广播消费等；
（6）各个环节分布式扩展设计，支持主从和高可用；
（7）开发度较活跃，版本更新很快。

缺点
（1）支持的客户端语言很少，目前是 Java 及 C++，其中 C++ 还不成熟；
（2）RocketMQ 社区关注度及成熟度也不及前二者；
（3）没有 Web 管理界面，提供了一个 CLI (命令行界面) 管理工具带来查询、管理和诊断各类问题；
（4）没有在 MQ 核内心实现 JMS 等接口；

1.4 Kafka
简介
Apache Kafka 是一个分布式消息发布订阅系统。它最初由 LinkedIn 公司基于独特的设计实现为一个分布式的日志提交系统 (a distributed commit log)，以后成为 Apache 项目的一部分。Kafka 性能高效、可扩展良好而且可持久化。它的分区特性，可复制和可容错都是其不错的特性。

主要特性
（1）快速持久化：能够在 O(1) 的系统开销下进行消息持久化；
（2）高吞吐：在一台普通的服务器上既能够达到 10W/s 的吞吐速率；
（3）彻底的分布式系统：Broker、Producer 和 Consumer 都原生自动支持分布式，自动实现负载均衡；
（4）支持同步和异步复制两种高可用机制；
（5）支持数据批量发送和拉取；
（6）零拷贝技术(zero-copy)：减小 IO 操做步骤，提升系统吞吐量；
（7）数据迁移、扩容对用户透明；
（8）无需停机便可扩展机器；
（9）其余特性：丰富的消息拉取模型、高效订阅者水平扩展、实时的消息订阅、亿级的消息堆积能力、按期删除机制；

部署环境
使用 Kafka 须要：
（1）Java JDK
（2）Kafka 安装包

优势
（1）客户端语言丰富：支持 Java、.Net、PHP、Ruby、Python、Go 等多种语言；
（2）高性能：单机写入 TPS 约在 100 万条/秒，消息大小 10 个字节；
（3）提供彻底分布式架构，并有 replica 机制，拥有较高的可用性和可靠性，理论上支持消息无限堆积；
（4）支持批量操做；
（5）消费者采用 Pull 方式获取消息。消息有序，经过控制可以保证全部消息被消费且仅被消费一次；
（6）有优秀的第三方 Kafka Web 管理界面 Kafka-Manager；
（7）在日志领域比较成熟，被多家公司和多个开源项目使用。

缺点
（1）Kafka 单机超过 64 个队列/分区时，Load 时会发生明显的飙高现象。队列越多，负载越高，发送消息响应时间变长；
（2）使用短轮询方式，实时性取决于轮询间隔时间；
（3）消费失败不支持重试；
（4）支持消息顺序，可是一台代理宕机后，就会产生消息乱序；
（5）社区更新较慢。

2. 中间件比较

2.1 比较一
ZeroMq 最好，RabbitMq 次之， ActiveMq 最差。这个结论来自于如下这篇文章。
http://blog.x-aeon.com/2013/04/10/a-quick-message-queue-benchmark-activemq-rabbitmq-hornetq-qpid-apollo/
测试环境：
Model: Dell Studio 1749
CPU: Intel Core i3 @ 2.40 GH
RAM: 4 Gb
OS: Windows 7 64 bits

其中包括持久化消息和瞬时消息的测试。注意这篇文章里面提到的MQ，都是采用默认配置的，并没有调优。

更多的统计图请参看我提供的文章url。

2.2 比较二
ZeroMq 最好，RabbitMq次之， ActiveMq最差。这个结论来自于一下这篇文章。http://www.cnblogs.com/amityat/archive/2011/08/31/2160293.html
显示的是发送和接受的每秒钟的消息数。整个过程共产生1百万条1K的消息。测试的执行是在一个Windows Vista上进行的。

2.3 持久化消息比较
zeroMq不支持，activeMq和rabbitMq都支持。持久化消息主要是指：MQ down或者MQ所在的服务器down了，消息不会丢失的机制。

2.4 技术点：可靠性、灵活的路由、集群、事务、高可用的队列、消息排序、问题追踪、可视化管理工具、插件系统、社区
RabbitMq最好，ActiveMq次之，ZeroMq最差。固然ZeroMq也能够作到，不过本身必须手动写代码实现，代码量不小。尤为是可靠性中的：持久性、投递确认、发布者证明和高可用性。因此在可靠性和可用性上，RabbitMQ是首选，虽然ActiveMQ也具有，可是它性能不及RabbitMQ。

2.5 高并发
从实现语言来看，RabbitMQ最高，缘由是它的实现语言是天生具有高并发高可用的erlang语言。

2.6 整体比较

结论：
（1）Kafka 在于分布式架构，RabbitMQ 基于 AMQP 协议来实现，RocketMQ 的思路来源于 Kafka，改为了主从结构，在事务性和可靠性方面作了优化。普遍来讲，电商、金融等对事务一致性要求很高的，能够考虑 RabbitMQ 和 RocketMQ，对性能要求高的可考虑 Kafka。
（2）按照目前网络上的资料，RabbitMQ、activeMQ、zeroMQ三者中，综合来看，RabbitMQ是首选，可是activeMQ与Java结合度比较好。