“戏”说spark---spark Shuffle详解(一)

“戏”说spark---spark Shuffle详解(一) Shuffle简介 Shuffle描述着数据从map task输出到reduce task输入的这段过程。shuffle是链接Map和Reduce之间的桥梁,Map的输出要用到Reduce中必须通过shuffle这个环节,shuffle的性能高低直接影响了整个程序的性能和吞吐量。由于在分布式状况下,reduce task须要跨节点去拉取
相关文章
相关标签/搜索