Flume的多层代理和防止数据丢失

时间 2021-01-18

标签 flume数据完整性 flume多层代理 Flume代理栏目日志分析繁體版

原文原文链接

当我们用Flume采集日志时，由于数据源的多样性，则往往需要配置多个Flume进行采集，如果只是使用单层Flume的话，那么往往会产生很多个文件夹，单个文件夹也只是来自同一个节点的数据组成的。而实际开发中，为了减少HDFS的压力，同时提高后续MR的处理效率。往往会将同一组多个节点的数据汇聚到同一个文件中，这样同时也较少了数据从生产到分析的时间。如下图，第一次agent

>>阅读原文<<