Spark的两种核心shuffle是什么?

spark的Shuffle有Hash Shuffle和Sort Shuffle两种。 在Spark 1.2以前,默认的shuffle计算引擎是HashShuffleManager。   HashShuffleManager有着一个非常严重的弊端,就是会产生大量的中间磁盘文件,进而由大量的磁盘IO操作影响了性能。因此在Spark 1.2以后的版本中,默认的ShuffleManager改成了SortS
相关文章
相关标签/搜索