spark任务提交流程与管依赖和窄依赖

spark内核执行流程图 表明4个阶段 1构建RDD,进行join,groupBy,filter操做,造成DAG有向无环图(有方向,没有闭环),在最后一个action时完成DAG图,表明着数据流向 2提交DAG为DAGScheduler,DAG调度器,主要是将DAG划分红一个个stage,而且提交stage 切分的依据是宽依赖,也就是有网络的传递 3TaskScheduler,Task调度器,启动
相关文章
相关标签/搜索