大数据入门与实战-Hadoop生态圈技术总览

1 Hadoop生态圈技术纵览 2 分布式概念 3 HDFS 读写过程 HDFS 读过程 HDFS 写过程 4 伪分布式集群 5 MapReduce MapReduce是一个编程框架,允许我们在分布式环境中对大型数据集执行分布式和并行处理: MapReduce由两个不同的任务组成 Map和Reduce。 正如MapReduce的名称所示,reducer阶段发生在mapper阶段完成之后。 因此,第
相关文章
相关标签/搜索