Spark原理之SortShuffle

介绍: 在Spark 1.2以前,默认的shuffle计算引擎是HashShuffleManager。HashShuffleManager采用的hashShuffle机制很大的问题就是产生大量的中间磁盘文件,产生的大量磁盘IO操作会有性能问题。 在Spark 1.2以后的版本中,默认的ShuffleManager改成了SortShuffleManager。SortShuffleManager相较于
相关文章
相关标签/搜索