Spark学习笔记三之RDD是个什么东西

RDD可以说是Spark Core最核心的内容,这一篇开始我将根据自己的理解针对RDD进行深入的剖析。 注意一些关于Spark Core的简单的概念理解,请参考一下我的这篇博客: Spark学习笔记二之Spark Core核心概念一网打尽 简介 定义 ​ RDD(Resilient Distributed Datasets) ,直译成中文就是:弹性分布式数据集。 ​ 本质上,RDD 其实就是一系列
相关文章
相关标签/搜索