Spark DAGScheduler 功能及源码解析

Spark中DAGScheduler的主要做用是将Job按照RDD的依赖关系划分红若干个TaskSet,也称为Stage;以后结合当前缓存状况及数据就近的原则,将Stage提交给TaskSchedulerjava private[spark] class DAGScheduler( private[scheduler] val sc: SparkContext, private[scheduler
相关文章
相关标签/搜索