Spark部分:RDD的五大特性【大数据开发面试】

Spark核心RDD         1).RDD(Resilient Distributed Dateset),弹性分布式数据集。Spark底层操作数据都是基于RDD。         2).RDD五大特性:             a).RDD由一系列Partition组成。             b).函数(算子)是作用在partition上的。             c).RDD之间有
相关文章
相关标签/搜索