Hadoop 之 深入探索MapReduce

1.MapReduce基础概念 答:MapReduce作业时一种大规模数据的并行计算的便程模型。我们可以将HDFS中存储的海量数据,通过MapReduce作业进行计算,得到目标数据。 2.MapReduce的四个阶段 答:Split阶段、Map阶段(需要编码)、Shuffle阶段、Reduce阶段(需要编码),下面以WordCount为例。 3.从分片到Map 答:我们知道输入的文件时存在Data
相关文章
相关标签/搜索