Spark运行架构------学习笔记

基本概念: RDD:是Resillient Distributed Dataset(弹性分布式数据集)的简称,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型 DAG:是Directed Acyclic Graph(有向无环图)的简称,反映RDD之间的依赖关系 Executor:是运行在工作节点(WorkerNode)的一个进程,负责运行Task Application:用户编写的Sp
相关文章
相关标签/搜索