spark的执行流程(源码解说)

1>spark的做业主要是由rdd的action所触发做业的提交,根据提交做业构建DAG图。将做业提交给sparkcontxt,在sparkcontext会建立2个重要组件,一个是dagscheduler和taskscheduler组件。最终运行sc.runjob将做业提交给Dagschedulerspa 2>Dagscheduler会根据DAG图进行stage的划分排序            
相关文章
相关标签/搜索