Shuffle阶段的自我理解

Shuffle阶段的概述 Shuffle是链接map,reduce两个管道的衔接套。Map的输出通过partition写到内存的buffer里面,当内存满了的时候,会排序写到零时文件,这样当mapTask整个运行完以后,会产生一大堆零时文件,shuffle要把它们merge在一块儿。(会调用combine函数) Reduce端经过TaskTracker监听到本身的须要数据的哪一个map运行完了,就
相关文章
相关标签/搜索