理解Spark之一——stage划分

时间 2021-01-11

原文原文链接

我们首先知道Spark的基本执行流程，简化来说，当提交一个Spark程序，HDFS上的每个Block对应一个分区、一个Task任务，这个Task任务就是在跑我们开发是Spark程序，程序中是我们使用的一个个算子。在算子中，又可以划分成为两种，一种是宽依赖、一种是窄依赖，它们和stage的关系就是宽依赖是划分stage的边界，窄依赖并不会划分stage。那么为什么需要stage这个

>>阅读原文<<

1. Spark DAG之划分Stage
2. Spark源码解析之Stage划分
3. Spark的Stage划分
4. Spark Stage 的划分
5. Spark源码分析之三：Stage划分
6. Spark-Stage任务划分
7. Spark中stage的划分
8. spark学习-50-Spark的stage的划分
9. spark源码系列(4) spark stage划分
10. spark stage 的理解
更多相关文章...
• Git 分支管理 - Git 教程
• BASE原理与最终一致性 - NoSQL教程
• Docker 清理命令
• 常用的分布式事务解决方案