DAG

什么是DAG 在Spark里每个操做生成一个RDD,RDD之间连一条边,最后这些RDD和他们之间的边组成一个有向无环图,这个就是DAG。分布式 Spark 为何要构建DAG? Spark会根据宽依赖窄依赖来划分具体的Stage,而依赖有2个做用:ide 用来解决数据容错的高效性; 其二用来划分stage。 RDD的依赖关系分为两种:窄依赖(Narrow Dependencies)与宽依赖(Wide
相关文章
相关标签/搜索