《大数据计算引擎之Spark》一、基本原理

  前两篇我们讲了spark的基础知识,包括spark的体系结构、执行框架、spark的基本数据类型以及spark中stage的划分等等。本篇要介绍spark运行的原理。包括spark的内部执行机制,spark的基本数据类型RDD的执行流程。 1. Spark内部执行机制 1.1 内部执行流程 spark的内部执行机制在《spark基础•下篇》已有介绍,此处再简单介绍下。   如下图1为分布式集群
相关文章
相关标签/搜索