Spark - 宽依赖 & 窄依赖

宽依赖:指一个父RDD的Partition会被多个子RDD的Partition所使用,例如,groudByKey,ReduceByKey,sortByKey等操作都会产生宽依赖。 窄依赖:指每个父RDD的一个Partition最多被子RDD的一个Partition所使用,例如,Map,filter,union等操作都会产生窄依赖。 需要注意的是,如果两个RDD在进行join操作时,一个RDD的pa
相关文章
相关标签/搜索