spark 基础 下

上篇介绍了spark的突出特色以及基本框架,下面给你们介绍下spark的基本数据结构、spark任务调度的详细流程以及spark中stage的划分。算法 5. spark的基本数据类型 RDD、DataFrame和DataSet能够说是spark独有的三种基本的数据类型。Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据
相关文章
相关标签/搜索