大数据知识宝典(Spark篇之shuffle过程)

注:本文主要摘录于尚硅谷大数据的学习资料,仅作学习记录,请勿用于商业用途。 Spark shuffle过程 HashShuffle过程介绍 Spark丰富了任务类型,有些任务之间数据流转不需要通过Shuffle,但是有些任务之间还是需要通过Shuffle来传递数据,比如wide dependency的group by key。 Spark中需要Shuffle输出的Map任务会为每个Reduce创建
相关文章
相关标签/搜索