轻量级日志收集技术方案

时间 2019-11-29

标签轻量级日志收集技术方案繁體版

原文原文链接

1. 传统架构

说明：php

在生产环境上部署rsync传输脚本并设置定时，按天或按小时将日志传输到日志收集服务器web

1）优势shell

2）缺点框架

说明：spa

Flume是一个分布式、可靠、和高可用的海量日志聚合的系统，支持在系统中定制各种数据发送方。

采用了分层架构：分别为agent，collector和storage。其中，agent和collector均由两部分组成：source和sink，source是数据来源，sink是数据去向。

Flume使用两个组件：Master和Node，Node根据在Master shell或web中动态配置，决定其是做为Agent仍是Collector。

1）优势

2）缺点

说明：

实线表示日志数据，虚线表示心跳和告警数据。

在生产服务器上增长agent数据监控服务，在日志收集服务器上部署beanstalkd队列服务，agent负责把生产服务器产生的日志实时写入到队列中去。

在日志收集服务器上部署Collector数据代理服务，负责将队列中的数据取出进行处理汇总。

Master和Collector能够部署在同一台服务器。

1）优势

2）缺点

1）引入实时流计算框架storm，更好地对大数据进行实时分析处理；

2）直接传输至HDFS，进行离线大数据计算，主要对一些日期久远的日志及不须要实时计算的日志进行统计分析。