MapReduce的Shuffle过程

时间 2021-07-10

原文原文链接

整个MapReduce的运行过程 input --> map --> shuffle -->reduce --->output 以wordcount数据模型为例 Map的输出数据模式如下：<hadoop,1><spark,1>以<key,value>对的形式存在因为map阶段是对整个文件中的每一个元素进行处理，对于Map的输出量是很大的。 Shuffle阶段 1>Map的数据会写入到内存(环形缓