子雨大数据之Spark入门教程---Spark入门:Spark运行架构1.2

本节首先介绍Spark的基本概念和架构设计方法,而后介绍Spark运行基本流程。数据库 基本概念 在具体讲解Spark运行架构以前,须要先了解几个重要的概念: *  RDD:是弹性分布式数据集(Resilient Distributed Dataset)的简称,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型; *  DAG:是Directed Acyclic Graph(有向无环
相关文章
相关标签/搜索