原文连接:关于消息队列的使用html
1、消息队列概述
消息队列中间件是分布式系统中重要的组件,主要解决应用解耦,异步消息,流量削锋等问题,实现高性能,高可用,可伸缩和最终一致性架构。目前使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ前端
2、消息队列应用场景
如下介绍消息队列在实际应用中经常使用的使用场景。异步处理,应用解耦,流量削锋和消息通信四个场景。java
2.1异步处理
场景说明:用户注册后,须要发注册邮件和注册短信。传统的作法有两种 1.串行的方式;2.并行方式
a、串行方式:将注册信息写入数据库成功后,发送注册邮件,再发送注册短信。以上三个任务所有完成后,返回给客户端。数据库
b、并行方式:将注册信息写入数据库成功后,发送注册邮件的同时,发送注册短信。以上三个任务完成后,返回给客户端。与串行的差异是,并行的方式能够提升处理的时间后端
假设三个业务节点每一个使用50毫秒钟,不考虑网络等其余开销,则串行方式的时间是150毫秒,并行的时间多是100毫秒。
由于CPU在单位时间内处理的请求数是必定的,假设CPU1秒内吞吐量是100次。则串行方式1秒内CPU可处理的请求量是7次(1000/150)。并行方式处理的请求量是10次(1000/100)
小结:如以上案例描述,传统的方式系统的性能(并发量,吞吐量,响应时间)会有瓶颈。如何解决这个问题呢?安全
引入消息队列,将不是必须的业务逻辑,异步处理。改造后的架构以下:
按照以上约定,用户的响应时间至关因而注册信息写入数据库的时间,也就是50毫秒。注册邮件,发送短信写入消息队列后,直接返回,所以写入消息队列的速度很快,基本能够忽略,所以用户的响应时间多是50毫秒。所以架构改变后,系统的吞吐量提升到每秒20 QPS。比串行提升了3倍,比并行提升了两倍。服务器
2.2应用解耦
场景说明:用户下单后,订单系统须要通知库存系统。传统的作法是,订单系统调用库存系统的接口。以下图:
传统模式的缺点:假如库存系统没法访问,则订单减库存将失败,从而致使订单失败,订单系统与库存系统耦合网络
如何解决以上问题呢?引入应用消息队列后的方案,以下图:
订单系统:用户下单后,订单系统完成持久化处理,将消息写入消息队列,返回用户订单下单成功
库存系统:订阅下单的消息,采用拉/推的方式,获取下单信息,库存系统根据下单信息,进行库存操做
假如:在下单时库存系统不能正常使用。也不影响正常下单,由于下单后,订单系统写入消息队列就再也不关心其余的后续操做了。实现订单系统与库存系统的应用解耦数据结构
2.3流量削锋
流量削锋也是消息队列中的经常使用场景,通常在秒杀或团抢活动中使用普遍。
应用场景:秒杀活动,通常会由于流量过大,致使流量暴增,应用挂掉。为解决这个问题,通常须要在应用前端加入消息队列。
a、能够控制活动的人数
b、能够缓解短期内高流量压垮应用
用户的请求,服务器接收后,首先写入消息队列。假如消息队列长度超过最大数量,则直接抛弃用户请求或跳转到错误页面。
秒杀业务根据消息队列中的请求信息,再作后续处理架构
2.4日志处理
日志处理是指将消息队列用在日志处理中,好比Kafka的应用,解决大量日志传输的问题。架构简化以下
日志采集客户端,负责日志数据采集,定时写受写入Kafka队列
Kafka消息队列,负责日志数据的接收,存储和转发
日志处理应用:订阅并消费kafka队列中的日志数据
2.5消息通信
消息通信是指,消息队列通常都内置了高效的通讯机制,所以也能够用在纯的消息通信。好比实现点对点消息队列,或者聊天室等
点对点通信:
客户端A和客户端B使用同一队列,进行消息通信。
聊天室通信:
客户端A,客户端B,客户端N订阅同一主题,进行消息发布和接收。实现相似聊天室效果。
以上实际是消息队列的两种消息模式,点对点或发布订阅模式。模型为示意图,供参考。
3、消息中间件示例
3.1电商系统
消息队列采用高可用,可持久化的消息中间件。好比Active MQ,Rabbit MQ,Rocket Mq。
(1)应用将主干逻辑处理完成后,写入消息队列。消息发送是否成功能够开启消息的确认模式。(消息队列返回消息接收成功状态后,应用再返回,这样保障消息的完整性)
(2)扩展流程(发短信,配送处理)订阅队列消息。采用推或拉的方式获取消息并处理。
(3)消息将应用解耦的同时,带来了数据一致性问题,能够采用最终一致性方式解决。好比主数据写入数据库,扩展应用根据消息队列,并结合数据库方式实现基于消息队列的后续处理。
3.2日志收集系统
分为Zookeeper注册中心,日志收集客户端,Kafka集群和Storm集群(OtherApp)四部分组成。
Zookeeper注册中心,提出负载均衡和地址查找服务
日志收集客户端,用于采集应用系统的日志,并将数据推送到kafka队列
Kafka集群:接收,路由,存储,转发等消息处理
Storm集群:与OtherApp处于同一级别,采用拉的方式消费队列中的数据
4、JMS消息服务
讲消息队列就不得不提JMS 。JMS(JAVA Message Service,java消息服务)API是一个消息服务的标准/规范,容许应用程序组件基于JavaEE平台建立、发送、接收和读取消息。它使分布式通讯耦合度更低,消息服务更加可靠以及异步性。
在EJB架构中,有消息bean能够无缝的与JM消息服务集成。在J2EE架构模式中,有消息服务者模式,用于实现消息与应用直接的解耦。
4.1消息模型
在JMS标准中,有两种消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)。
4.1.1 P2P模式
P2P模式包含三个角色:消息队列(Queue),发送者(Sender),接收者(Receiver)。每一个消息都被发送到一个特定的队列,接收者从队列中获取消息。队列保留着消息,直到他们被消费或超时。
P2P的特色
每一个消息只有一个消费者(Consumer)(即一旦被消费,消息就再也不在消息队列中)
发送者和接收者之间在时间上没有依赖性,也就是说当发送者发送了消息以后,无论接收者有没有正在运行,它不会影响到消息被发送到队列
接收者在成功接收消息以后需向队列应答成功
若是但愿发送的每一个消息都会被成功处理的话,那么须要P2P模式。
4.1.2 Pub/Sub模式
包含三个角色主题(Topic),发布者(Publisher),订阅者(Subscriber) 多个发布者将消息发送到Topic,系统将这些消息传递给多个订阅者。
Pub/Sub的特色
每一个消息能够有多个消费者
发布者和订阅者之间有时间上的依赖性。针对某个主题(Topic)的订阅者,它必须建立一个订阅者以后,才能消费发布者的消息
为了消费消息,订阅者必须保持运行的状态
为了缓和这样严格的时间相关性,JMS容许订阅者建立一个可持久化的订阅。这样,即便订阅者没有被激活(运行),它也能接收到发布者的消息。
若是但愿发送的消息能够不被作任何处理、或者只被一个消息者处理、或者能够被多个消费者处理的话,那么能够采用Pub/Sub模型。
4.2消息消费
在JMS中,消息的产生和消费都是异步的。对于消费来讲,JMS的消息者能够经过两种方式来消费消息。
(1)同步
订阅者或接收者经过receive方法来接收消息,receive方法在接收到消息以前(或超时以前)将一直阻塞;
(2)异步
订阅者或接收者能够注册为一个消息监听器。当消息到达以后,系统自动调用监听器的onMessage方法。
JNDI:Java命名和目录接口,是一种标准的Java命名系统接口。能够在网络上查找和访问服务。经过指定一个资源名称,该名称对应于数据库或命名服务中的一个记录,同时返回资源链接创建所必须的信息。
JNDI在JMS中起到查找和访问发送目标或消息来源的做用。
5、经常使用消息队列
通常商用的容器,好比WebLogic,JBoss,都支持JMS标准,开发上很方便。但免费的好比Tomcat,Jetty等则须要使用第三方的消息中间件。本部份内容介绍经常使用的消息中间件(Active MQ,Rabbit MQ,Zero MQ,Kafka)以及他们的特色。
5.1 ActiveMQ
ActiveMQ 是Apache出品,最流行的,能力强劲的开源消息总线。ActiveMQ 是一个彻底支持JMS1.1和J2EE 1.4规范的 JMS Provider实现,尽管JMS规范出台已是好久的事情了,可是JMS在当今的J2EE应用中间仍然扮演着特殊的地位。
ActiveMQ特性以下:
⒈ 多种语言和协议编写客户端。语言: Java,C,C++,C#,Ruby,Perl,Python,PHP。应用协议: OpenWire,Stomp REST,WS Notification,XMPP,AMQP
⒉ 彻底支持JMS1.1和J2EE 1.4规范 (持久化,XA消息,事务)
⒊ 对Spring的支持,ActiveMQ能够很容易内嵌到使用Spring的系统里面去,并且也支持Spring2.0的特性
⒋ 经过了常见J2EE服务器(如 Geronimo,JBoss 4,GlassFish,WebLogic)的测试,其中经过JCA 1.5 resource adaptors的配置,可让ActiveMQ能够自动的部署到任何兼容J2EE 1.4 商业服务器上
⒌ 支持多种传送协议:in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA
⒍ 支持经过JDBC和journal提供高速的消息持久化
⒎ 从设计上保证了高性能的集群,客户端-服务器,点对点
⒏ 支持Ajax
⒐ 支持与Axis的整合
⒑ 能够很容易得调用内嵌JMS provider,进行测试
5.2 Kafka
Kafka是一种高吞吐量的分布式发布订阅消息系统,它能够处理消费者规模的网站中的全部动做流数据。 这种动做(网页浏览,搜索和其余用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据一般是因为吞吐量的要求而经过处理日志和日志聚合来解决。 对于像Hadoop的同样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。Kafka的目的是经过Hadoop的并行加载机制来统一线上和离线的消息处理,也是为了经过集群机来提供实时的消费。
Kafka是一种高吞吐量的分布式发布订阅消息系统,有以下特性:
经过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即便数以TB的消息存储也可以保持长时间的稳定性能。(文件追加的方式写入数据,过时的数据按期删除)
高吞吐量:即便是很是普通的硬件Kafka也能够支持每秒数百万的消息
支持经过Kafka服务器和消费机集群来分区消息
支持Hadoop并行数据加载
Kafka相关概念
Broker
Kafka集群包含一个或多个服务器,这种服务器被称为broker[5]
Topic
每条发布到Kafka集群的消息都有一个类别,这个类别被称为Topic。(物理上不一样Topic的消息分开存储,逻辑上一个Topic的消息虽然保存于一个或多个broker上但用户只需指定消息的Topic便可生产或消费数据而没必要关心数据存于何处)
Partition
Parition是物理上的概念,每一个Topic包含一个或多个Partition.
Producer
负责发布消息到Kafka broker
Consumer
消息消费者,向Kafka broker读取消息的客户端。
Consumer Group
每一个Consumer属于一个特定的Consumer Group(可为每一个Consumer指定group name,若不指定group name则属于默认的group)。
通常应用在大数据日志处理或对实时性(少许延迟),可靠性(少许丢数据)要求稍低的场景使用。
1. 消息队列中的“消息”即指同一台计算机的进程间,或不一样计算机的进程间传送的数据;
“消息队列”是在消息的传输过程当中保存消息的容器。
消息被发送到队列中,消息队列充当中间人,将消息从它的源中继到它的目标。
2. 传统的进程通讯模式如图1左所示:client调用service,等待service的响应。可是这种模式有不少弊端:
-网络状况很差时,client到Service的调用可能会丢失;
-或者service若是处理时间较长,那么client须要一直hold,甚至调用超时而失败;
-或者service的些许改动会带来client的代码修改等等。
3. 引入消息队列则能够避免这种传统模式的弊端,如图1右所示:
图1(左) 典型的Invoke/Respond模型 图1(右) 典型的消息队列处理流程
4. 消息队列能够带来以下好处:
(1)保证消息的传递。
若是发送消息时接收者不可用,消息队列会保留消息,直到成功地传递它;
(2)提供异步的通讯协议。
消息的发送者将消息发送到消息队列后能够当即返回,不用等待接收者的响应,消息会被保存在队列中,直到接收者取出它;
(3)解耦,下降两个进程间的耦合度。
只要消息格式不变,即便接收者的接口、位置、或者配置改变,也不会给发送者带来任何改变;
并且,消息发送者无需知道消息接收者是谁,使得系统设计更清晰;
相反的,例如,远程过程调用(RPC)或者服务间经过socket创建链接,若是对方接口改变了或者对方ip、端口改变了,那么另外一方须要改写代码或者改写配置;
(4)提供路由。
发送者无需与接收者创建链接,双方经过消息队列保证消息可以从发送者路由到接收者,甚至对于原本相互网络不通的两个服务,也能够提供消息路由。
可靠
分布式消息队列提供更好的可靠性,主要体如今:
1. 消息会被持久化到分布式存储中。这样避免了单台机器存储的消息因为机器问题致使消息的丢失;
2. 不佳的网络环境中,保证只有当消息的接收者确实收到消息时才从队列中删除消息。
可扩展
可扩展性体如今访问量和数据量两个方面:
访问量:分布式消息队列服务,会随着访问量的增减而自动增减逻辑处理服务器;
数据量:当数据量扩大时,后端分布式存储会自动扩容。
安全
安全体如今如下两个方面:
1. 同时使用消息队列的业务之间不会互相干扰
若是有多个业务同时在使用消息队列,对于单机的消息队列服务,一个业务的消息操做可能会影响其余业务的正常运行。
好比,一个业务的消息操做特别频繁,占据了消息队列的绝大部分服务时间,也占据了这台服务器的绝大部分网络IO,致使其余业务没法正常地与消息队列通讯。
并且甚至可能因为服务控制不当,致使机器崩溃,服务中止,业务也跟着中止。
分布式消息队列则不会出现这个问题:
(1)监控措施完善,系统性能指数会控制在必定范围以内,并且有任何异常也会报警;
(2)当访问量和数据量增大时,分布式消息队列服务能够自动扩展。
2. 各业务的消息内容是安全存储的,其余业务不能访问到非自身业务的数据。
一方面是业务须要密钥来访问消息队列;另外一方面,消息是被加密存储的。
简单实用简单实用体如今:1.透明:接收者和发送者无需知道具体的消息队列的服务器地址,服务器的增减对接收者和发送者透明。2. 实用:对于两个服务之间不能通讯的网络状况,消息队列为他们提供了恰到好处的桥梁。