Spark四种性能调优思路(三)——shuffle调优

Spark中的性能消耗主要都是在shuffle环节,对shuffle部分进行调优是很有必要的 Spark中负责shuffle过程的执行、计算和处理的组件主要就是ShuffleManager。在0.8的版本中出现了优化之后的HashShuffleManager,同时在spark1.2的版本出现的SortShuffleManager成为了默认的shuffle处理方式,目前的版本就只有一个SortShu
相关文章
相关标签/搜索