Spark 的做业执行原理

参见书籍 《图解Spark:核心技术与案例实战》多线程 要点概述spa ** 做业(Job)提交后由行动操做触发做业执行,根据RDD的依赖关系构建DAG图,由DAGSheduler(面向阶段的任务调度器)解析线程 ** DAGSheduler在解析DAG图时是以RDD的依赖是否为宽依赖,当遇到宽依赖就划分为一个新的调度阶段。每一个调度阶段都包含一个或者是多个任务(Task),多个Task组成任务集
相关文章
相关标签/搜索