Spark 的两种 Shuffle

文章目录 1. HashShuffle 1. 优化前 2. 优化后 2. SortShuffle 1. 普通运行机制 2. bypass运行机制 1. HashShuffle 1. 优化前 1. shuffle write阶段,主要就是在一个stage结束计算以后,为了下一个stage能够执行shuffle类的算子(好比reduceByKey), 而将每一个task处理的数据按key进行“划分”。
相关文章
相关标签/搜索