Hadoop7days -7 flume

Flume是一个数据采集系统,从WebServer上采集数据后通过Agent存储到HDFS上。 Agent分为三个组件Source(采集到的资源),Channel(管道,暂时存放采集到的数据),Sink(通过它将数据存储到HDFS中)。Flume不依赖与Hadoop,只要安装有jdk的机器都可以运行它。 如下所示的配置文件配置了一个名为a4的Agent,这个配置文件监视a4.sources.r1.
相关文章
相关标签/搜索