Spark宽窄依赖

      Spark中RDD的高效与DAG图有着莫大的关系,在DAG调度中需要对计算过程划分stage,而划分依据就是RDD之间的依赖关系。针对不同的转换函数,RDD之间的依赖关系分类窄依赖(narrow dependency)和宽依赖(wide dependency, 也称 shuffle dependency). 宽依赖与窄依赖 窄依赖是指父RDD的每个分区只被子RDD的一个分区所使用,子R
相关文章
相关标签/搜索