对DAG的粗略理解

当一个job提交后,最后一个RDD执行action算子从所有的父级依赖查找shuffle依赖,找到shuffle依赖后创建一个shuffle map stage,在stage中的必定是narrow依赖,narrow依赖中的是task任务,有多少个partition就有多少个task,多个task称作taskset任务集,一个任务集就是一个stage,task在进程上运行,运行完后释放所有资源。 R
相关文章
相关标签/搜索