Spark之RDD的概念及其五大特性

  RDD,弹性分布式数据集,是spark的底层数据结构。RDD是一个容错的,能够被并行操做的数据集合。RDD的特色之一是分布式存储,它的好处就是数据存储在不一样的节点上,当须要数据进行计算的时候能够在这些节点上并行操做。弹性表如今节点在存储RDD数据的时候,既能够存储在内存中,也能够存储在磁盘上,也能够二者结合使用。RDD还有个特色就是延迟计算,当是transformation算子的时候,并不执
相关文章
相关标签/搜索