Spark任务执行流程

这是Spark官方给的图,大体意思就是:web 四个步骤 1.构建DAG(有向无环图)(调用RDD上的方法) 2.DAGScheduler将DAG切分Stage(切分的依据是Shuffle),将Stage中生成的Task以TaskSet的形式给TaskScheduler 3.TaskScheduler调度Task(根据资源状况将Task调度到相应的Executor中) 4.Executor接收Ta
相关文章
相关标签/搜索