spark2原理分析-Stage的实现原理

概述 本文介绍Spark任务执行框架中Stage的原理,并分析其实现机制。 Stage的基本概念 一个Stage是一个并行任务(Task实体)集,它们执行相同的计算逻辑,并作为Spark任务执行的一部分,所有的任务都具有相同的shuffle依赖。 调度器运行的每个任务DAG,在shuffle的边界处(发生shuffling时)被分解成多个stage,然后DAGScheduler以拓扑顺序运行这些阶
相关文章
相关标签/搜索