架构设计：系统间通讯（33）——其余消息中间件及场景应用（下3）

时间 2019-11-12

原文原文链接

===================================
（接上文：《架构设计：系统间通讯（32）——其余消息中间件及场景应用（下2）》）html

5-七、解决方案三：非侵入式方案

以上两种方案中为了让业务系统可以集成日志采集功能，咱们或多或少须要在业务系统端编写一些代码。虽然经过一些代码结构的设计，能够减小甚至彻底隔离这些代码和业务代码的耦合度，可是毕竟须要业务开发团队花费精力对这些代码进行维护，业务系统部署时业务对这些代码的配置信息作相应的调整。前端

这里咱们再为读者介绍一种非侵入式的日志采集方案。咱们都知道业务系统被访问时，都会产生一些访问痕迹。一样以“浏览商品详情”这个场景为例，当访问者打开一个“商品详情”页面时（URL记为A），那么首先Nginx的access日志就会有相应的80端口的访问日志，若是“商品详情”的信息并不是全静态的，那么接下来业务服务上工做的代码还会在Log4j文件上输出相应的访问信息（若是开发人员使用了Log4j的话）。咱们要作的事情就是找一款软件，将这些日志信息收集起来并存放在合适的位置，以便数据分析平台随后利用这些数据进行分析工做。web

固然为了保证这些日志信息中有完整的原始属性，业务系统的开发人员和运维人员应该事先协调一种双方都承认的日志描述格式，以及日志文件的存储位置和存储规则等信息。apache

5-7-一、Flume介绍

Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log data. It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with tunable reliability mechanisms and many failover and recovery mechanisms. It uses a simple extensible data model that allows for online analytic application.设计模式

以上文字引用来自Apache Flume官网（http://flume.apache.org/）。大意是：Flume是一个分布式的、具备高可靠的、高可用性的用于有效地收集、汇总日志数据的服务。它的架构基于数据流，简单灵活。。。咱们要介绍的非侵入日志采集方案，就基于Apache Flume进行实现。服务器

Apache Flume很是很是简单，而且官方给出的用户手册已经足够您了解它的使用方式和工做原理（http://flume.apache.org/FlumeUserGuide.html），因此本文并不会专门介绍Flume的安装和基本使用，并试着将Flume的使用融入到实例讲解中。若是您但愿更深刻学习Flume的设计实现，笔者仍是创建您阅读Flume的源代码，在其官网的用户文档中已经给出了几个关键的实现类，经过这些实现类便可倒查Flume使用的各类设计模式：网络

5-7-二、方案设计

Flume和业务服务系统在物理服务器上分别独立工做，在操做系统层面上是两个独立的进程，并无任何关联。Flume只对操做系统上的文件系统、或者指定的网络端口又或者RPC服务进行数据流监控（Flume中称之为Source）。当指定的文件、指定的网络端口或者指定的RPC服务有新的数据产生时，Flume就会按照预先的配置将这些数据传输到指定位置（Flume中称之为Sink）。这个指定位置能够是网络地址、能够是文件系统还能够是另外一个软件。Source和Sink之间的数据流传输通告，称之为Channel。架构

上图来源于Apache Flume官方网站，是一个关于Flume中Source、Sink的例子。在这个例子中，Flume采用一个HTTP Source，用来接收外部传来的HTTP协议的数据；Flume的Sink端采用HDFS Sink，用来将从Channel中获得的数据写入HDFS。那么基于上文介绍的Apache Flume工做特性，咱们采用以下思路进行日志采集方案三的设计：app

日志数据的来源和收集

上图中业务系统工做在140、14一、142三个物理节点上，并产生Log4j文件。固然您也能够直接使用JBOSS、Tomcat等服务的原生日志文件做为日志数据来源。有的状况下，咱们须要对Nginx等代理服务上Http请求状况进行分析，那么可使用Nginx的access.log文件做为日志数据的源是来源。您还能够根据设计须要，在每个物理节点上同时监控多个文件。负载均衡

在140、14一、142三个物理节点上，还分别安装了Apache Flume。他们的工做任务都是同样的，即从指定的须要监控的日志文件中读取数据变化，经过配置好的Channel送到指定的Sink中。在上图的设置中既是监控Log4j文件的变化，经过Channel使用Thrift RPC方式传输到远程服务器192.168.61.138的6666端口。

日志数据集中

物理节点192.168.61.138负责收集来自于140、14一、142三个物理节点经过Thrift RPC传输到6666端口的日志数据信息。而且经过Channel传输到适当的存储方案中，这些适当的存储方案多是HDFS、多是某一种MQ还多是某种对象存储系统（例如Ceph）、甚至可能就是本地文件系统。

5-7-三、方案配置过程

192.168.61.140

上文已经说明，192.168.61.140物理节点上Apache Flume的主要任务是监控业务服务的Log4j日志文件，当日志文件产生新的数据时，经过Flume中已经配置好的Channel发送至指定的Sink。配置信息以下：

agent.sources = s1
agent.channels = c1
agent.sinks = t1

# source ===========================
# log4j.log文件的变化将做为flume的源
agent.sources.s1.type = exec
agent.sources.s1.channels = c1
agent.sources.s1.command = tail -f /logs/log4j.log

# channel ==================================
# 链接source和sink的通道
agent.channels.c1.type = memory
agent.channels.c1.capacity = 1000

# sink t1 ===================================
# 经过通道送来的数据，将经过 thrift RPC调用，送到138节点的6666端口
agent.sinks.t1.type = thrift
agent.sinks.t1.channel = c1
agent.sinks.t1.hostname = 192.168.61.138
agent.sinks.t1.port = 6666

192.168.61.141和192.168.61.142两个物理节点也承载了业务服务，而且业务服务会将日志输出到一样的Log4j的位置。因此这两个节点上Apache Flume的配置和以上140物理节点中Apache Flume的配置一致。这里就再也不对另外两个物理节点的配置进行赘述了。

另外须要注意的是agent.sources.s1.command配置的Linux tail 命令。tail命令能够显示当前文件的变化状况，若是您只代有-f参数，即表示从文件末尾的最后10行开始对文件的变化状况进行监控。若是这样配置，那么当Flume启动时，就会认为Log4j文件中已经存在的10行记录为新收到的日志数据，形成误发。

要解决这个问题可使用-n参数，并指定从文件的最末尾开始监控文件变化状况：

# 应该使用
tail -f -n 0 /logs/log4j.log

# 注意：tail -f /logs/log4j.log 命令至关于：
# tail -f -n 10 /logs/log4j.log

192.168.61.138

192.168.61.138节点上的Flume，用来收集140-142节点经过Thrift RPC传来的日志数据。这些数据收集后，将被138节点上的Flume存放到合适的位置。这些位置能够是HDFS，HBASE、本地文件系统还能够是Apache Kafka等。

agent.sources = s1
agent.channels = c1
agent.sinks = t1

# thrift ==================
# 使用thrift rpc监听节点的6666端口，以便接收数据
agent.sources.s1.type = thrift
agent.sources.s1.channels = c1
agent.sources.s1.bind = 0.0.0.0
agent.sources.s1.port = 6666

# sink hdfs ==============
# agent.sinks.t1.type = hdfs
# agent.sinks.t1.channel = c1
# agent.sinks.t1.hdfs.path = hdfs://ip:port/events/%y-%m-%d/%H%M/%S
# agent.sinks.t1.hdfs.filePrefix = events-
# agent.sinks.t1.hdfs.round = true
# agent.sinks.t1.hdfs.roundValue = 10
# agent.sinks.t1.hdfs.roundUnit = minute

# sink=====================
# 为了检测整个配置是否正确，可先输出到控制台
agent.sinks.t1.type = logger
agent.sinks.t1.channel = c1

# channel=================
agent.channels.c1.type = memory
agent.channels.c1.capacity = 1000

以上配置文件中，为了查看这个采集系统的配置是否成功，咱们将在Flume控制台做为Sink进行输出。注释的信息是HDFS做为Sink的配置。

5-八、解决方案三优化

上一小节的解决方案三中，最薄弱的位置是承担日志数据汇总任务的138节点。整个日志收集主架构中只存在一个这样的汇总节点，一旦138节点因为各类缘由宕机主架构就将崩溃。即便138节点可以稳定工做，因为138节点同时承担多个物理节点传来的数据日志，那么它也极有可能成为性能瓶颈。因此咱们须要找到一种方案三中薄弱位置的办法。

5-8-一、Flume支持的高可用模式

还好，Apache Flume为咱们提供了很是简单实用的高可用模式：Load_balance模式和Failover模式。这两种工做模式都是对多个Sink如何配合工做进行描述：

Load_balance模式：

这种工做模式提供了多个sinks负载均衡的能力。Load_balance会维护一个active sinks列表，基于这个列表，使用round_robin(轮询调度) 或者 random（随机）的选择机制（默认为：round_robin），向sinks集合。基本上这两种选择方式已经够用了，若是您对调度选择有特别的要求，则能够经过继承AbstractSinkSelector类来实现自定义的选择机制。

Failover模式：

这种工做模式提供了多个sinks的故障转移能力。Failover维护了两个sinks列表，Failover list和Live list，在Failover模式下，Flume会优先选择优先级最高的Sink做为主要的发送目标。当这个Sink连续失败时Flume会把这个Sink移入Failover list，而且设置一个冷冻时间。在这个冷冻时间以后，Flume又会试图使用这个Sink发送数据，一旦发送成功，这个Sink会被从新移入Live list。

为了保证可以为数据汇总节点分担性能压力，咱们使用Load_balance模式进一步演示对数据汇总节点的优化。

5-8-二、使用Load_balance模式

从上图中能够看到在方案三的优化方法中，咱们使用一个新的节点（192.168.61.139）和原有的138节点一块儿构成一组负载节点，共同承担日志数据的汇总任务。那么前端日志监控节点（140、14一、142三个节点）也须要作相应的配置文件修改。

5-8-三、Load_balance配置过程

修改192.168.61.140节点

agent.sources = s1
agent.channels = c1
# 设置了两个sink
agent.sinks = lt1 lt2
agent.sinkgroups = g1

# source ===========================
# 数据源仍是来自于log4j日志文件的新增数据
agent.sources.s1.type = exec
agent.sources.s1.channels = c1
agent.sources.s1.command = tail -f -n 0 /log/log4j.log

# sink lt1 ===================================
agent.sinks.lt1.type = thrift
agent.sinks.lt1.channel = c1
agent.sinks.lt1.hostname = 192.168.61.138
agent.sinks.lt1.port = 6666

# sink lt2 ==================================
agent.sinks.lt2.type = thrift
agent.sinks.lt2.channel = c1
agent.sinks.lt2.hostname = 192.168.61.139
agent.sinks.lt2.port = 6666

# channel ==================================
agent.channels.c1.type = memory
agent.channels.c1.capacity = 1000

# sinkgroup ===============================
# 两个sink：lt1 lt2 设置成一组sink。并使用load_balance模式进行工做
agent.sinkgroups.g1.sinks = lt1 lt2
agent.sinkgroups.g1.processor.type = load_balance
agent.sinkgroups.g1.processor.backoff = true
agent.sinkgroups.g1.processor.selector = random

141和142两个日志数据监控节点的配置和140节点的配置一致，因此一样再也不赘述了。

新增192.168.61.139节点

agent.sources = s1
agent.channels = c1
agent.sinks = t1

# thrift==================
agent.sources.s1.type = thrift
agent.sources.s1.channels = c1
agent.sources.s1.bind = 0.0.0.0
agent.sources.s1.port = 6666

# sink=====================
agent.sinks.t1.type = logger
agent.sinks.t1.channel = c1

# channel=================
agent.channels.c1.type = memory
agent.channels.c1.capacity = 1000

新增的139节点上Flume的配置信息和原有138节点上Flume的配置信息是一致的。这样保证了不管日志数据被发送到哪个节点，都能正确进行存储。

5-9 方案三的局限性

日志采集方案三也存在局限性：这种方案不适合用于开放性日志采集系统。也就是说，若是您的日志采集系统须要像“百度站长统计工具”那样，从设计之初的目标就是要发布给互联网上各个站点使用的。那么这种基于操做系统日志变化，并采用第三方软件完成采集过程的架构方案就不适用。

另外，方案三咱们使用了Thrift RPC进行网络通信。这个方式是能够用于真正的生产环境的，可是须要进行更多的配置项指定。如下两个连接地址是分别是使用thrift做为source和sink时可使用的配置属性。

http://flume.apache.org/FlumeUserGuide.html#thrift-source
http://flume.apache.org/FlumeUserGuide.html#thrift-sink

除了Thrift RPC之外，笔者还推荐使用Avro。

六、场景应用——Online游戏：子弹弹道日志功能

//TODO 这是一个扣子，后续的文章会讲到

七、下文介绍

通过《架构设计：系统间通讯（19）——MQ：消息协议（上）》开始的14篇文章，咱们基本上介绍了消息队列的基本知识和使用实战。从下文开始咱们转向ESB企业服务总线的知识讲解。