Spark storage系列------3.Spark cache数据块以后对后继Job任务调度的影响,以及后继Job Task执行的影响

    DAGScheduler.submitStage创建Spark应用的物理执行图,DAGScheduler.submitStage经过调用DAGSchdeuler.getMissingParentStages找到一个Stage的祖宗Stage并把祖宗Stage加入到物理执行图中。在这里若是发现依赖的RDD的所有分区已经存储到了BlockManager,也就是已经成功Cache,那么这个RDD
相关文章
相关标签/搜索