Spark底层原理---Spark宽依赖和窄依赖深度剖析

RDD依赖关系与stage划分 Spark中RDD的高效与DAG图有着莫大的关系,在DAG调度中需要对计算过程划分stage,而划分依据就是RDD之间的依赖关系。 1. 窄依赖与宽依赖 针对不同的转换函数,RDD之间的依赖关系分为窄依赖(narrow dependency)和宽依赖(wide dependency,也成shuffle dependency)。 1.1 窄依赖 窄依赖是指1个父RDD
相关文章
相关标签/搜索