RDD深刻讲解

RDD原码:https://github.com/apache/spark/tree/master/core/src/main/scala/org/apache/spark/rddgit 什么是RDD? 一个弹性可分布式的数据集。弹性主要体如今计算之上。他是spark里一个最基本的抽象单元。表明了一个immutable(不可变的),可以并行操做的能够被分区的数据集 partitioned coll
相关文章
相关标签/搜索