MapReduce Shuffle 和 Spark Shuffle 区别看这篇

   MapReduce Shuffle 和 Spark Shuffle 区别看这篇即可 Shuffle的本意是洗牌、混洗的意思,把一组有规则的数据尽量打乱成无规则的数据。而在MapReduce中,Shuffle更像是洗牌的逆过程,指的是将map端的无规则输出按指定的规则“打乱”成具有一定规则的数据,以便reduce端接收处理。其在MapReduce中所处的工作阶段是map输出后到reduce接收
相关文章
相关标签/搜索