MapReduce的Shuffle过程

总的来说,Shuffle是Mapper和Reducer的中间步骤,它的功能是,将Mapper输出的键值对按照key值重新进行切分和组合,并将key值满足一定条件的键值对传送给特定的Reducer去处理。可以简化Reducer的工作。 Shuffle分为Map端和Reduce端两部分 一、Map端,如下图: input: 输入数据来源于block,当然map作业直接读取的是split partiti
相关文章
相关标签/搜索