flume概念介绍及工作机制(twenty-nine day first )

先理解一下flume 数据采集 业务系统产生的日志等需要分析的数据存在了HDFS上,或KAFKA上,或MYSQL里,这种各种的数据源里,然后分析以后将结果文件放到目标文件中。 接着框架flume出现了,它定义了一个数据采集的流程,1、读数据,2、缓存数据,3、写数据 为避免读数据和写数据的速度不匹配(写数据是恒定的,但业务系统因为各种原因产生数据有时候是不确定的,所以读数据是不确定的),所以需要缓
相关文章
相关标签/搜索