大数据学习笔记（五）

时间 2020-08-08

标签数据学习笔记繁體版

原文原文链接

1、Flume 1.1 概述 Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统。Flume支持从各类数据源中（如文件、文件夹、Socket数据包、Kafka等）收集数据；同时，Flume提供对数据进行简单处理，并把处理后的数据写出到HDFS、hbase、hive、kafka等众多外部存储系统。node 1.2 运行原理 Flume里面的几个比较重要的

>>阅读原文<<