hadoop运行原理之shuffle

 hadoop的核心思想是MapReduce,但shuffle又是MapReduce的核心。shuffle的主要工作是从Map结束到Reduce开始之间的过程。首先看下这张图,就能了解shuffle所处的位置。图中的partitions、copy phase、sort phase所代表的就是shuffle的不同阶段。      shuffle阶段又可以分为Map端的shuffle和Reduce端的
相关文章
相关标签/搜索