Mapreuce的Shuffle过程

    熟悉Mapreduce的同学,肯定对Map和Reduce的编写非常的6,那么从你的数据从Mapper类到Reducer类的传输要经过一个过程,这个过程就叫Shuffle,Shuffle过程是个无比重要的过程,它使你的数据从Mapper端出来之后更加整齐,规范,并且相同的Key的数据放在了一起输入到Reducer端,从某种意义上来说,Shuffle是MapReduce的心脏,是奇迹发生的地方
相关文章
相关标签/搜索