Flume基础

一. 简介 1) Flume 提供一个分布式的,可靠的,对大数据量的日志进行高效收集、聚集、移动的服务,Flume 只能在 Unix 环境下运行。 2) Flume 基于流式架构,容错性强,也很灵活简单。 3) Flume、Kafka 用来实时进行数据收集,Spark、Storm 用来实时处理数据,impala 用来实时查询。 二. 架构 三.核心组件 1. source        用于采集数
相关文章
相关标签/搜索