Flume实战

前言 在一个完整的大数据处理系统中,除了hdfs+mapreduce+hive组成分析系统的核心以外,还须要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助工具在hadoop生态体系中都有便捷的开源框架,如图所示: node Flume的一些简介 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 Flume能够采集文件,socket数据包等各类形式源数据,又
相关文章
相关标签/搜索