MapReduce——shuffle

Shuffle过程是MR的一个核心。 简答了解Shuffle的作用: 需求场景:   在集群环境下,Map task和Reduce task运行在不同的节点上,这个情况下Reduce执行时需要跨节点从其他节点上拉取Map task的输出结果。如果集群上又很多任务在运行,会在运行时消耗很严重的网络资源(这属于正常现象),这种现象无法改变,只能最大化的减少资源的消耗。在数据拉取过程中怎么改变?   1
相关文章
相关标签/搜索