SparkSQL实战1——先从Hadoop开始说起

1、Hadoop概述 广义的Hadoop,指的是Hadoop生态系统,Hadoop生态系统是一个很庞大的概念,狭义的Hadoop指的是Hadoop框架,Hadoop框架是Hadoop生态系统最重要最基础的一个部分,生态系统中的每一子系统只解决某一特定的问题域,不搞统一型的全能系统,而是小而精的多个小系统。 Flume:日志收集工具,它将数据从产生、传输、处理并最终写入目标的路径的过程抽象为数据流,
相关文章
相关标签/搜索