图解Shuffle

MapReduce需要确保每个reducer的输入都是按键(key)排序的,而系统执行排序,将map输出作为输入传给reducer的过程就是shuffle。 但是在某些描述上面,它只代表reduce任务获取map输出的这个部分。 而shuffle是mapReduce的核心,主要工作是从Map结束阶段到Reduce阶段,可以分为Map端的Shuffle和Reduce端的Shuffle。 1 Map端
相关文章
相关标签/搜索