剖析Hadoop和Spark的Shuffle过程差异（二）

时间 2021-01-08

原文原文链接

上一篇博客《剖析Hadoop和Spark的Shuffle过程差异（一）》剖析了Hadoop MapReduce的Shuffle过程，那么本篇博客，来聊一聊Spark shuffle。 Spark shuffle相对来说更简单，因为不要求全局有序，所以没有那么多排序合并的操作。Spark shuffle分为write和read两个过程。我们先来看shuffle write。