Spark内核深度剖析之宽依赖和窄依赖

在之前提到了DAGScheduler会将job划分为多个stage,而划分依据就是RDD之间的依赖关系。RDD之间的依赖关系分类窄依赖(narrow dependency)和宽依赖(wide dependency, 也称 shuffle dependency). 窄依赖:窄依赖是指一个RDD对它的父RDD只有简单的一对一的依赖关系,即RDD的每个partition只依赖于父RDD中的一个parti
相关文章
相关标签/搜索