hadoop 之mapreduce shuffle map输出过程

一、概要描述 shuffle是MapReduce的一个核心过程,因此没有在提交中描述,而是单独拿出来比较详细的描述。 根据官方的流程图示如下:  本篇文章中只是想尝试从代码分析来说明在map端是如何将map的输出保存下来等待reduce来取。 在执行每个map task时,无论map方法中执行什么逻辑,最终都是要把输出写到磁盘上。如果没有reduce阶段,则直接输出到hdfs上,如果有有reduc
相关文章
相关标签/搜索