Spark之RDD

Spark之RDD RDD的概述: 1.1什么是RDD RDD(Ressilient Distributed Dataset)名为弹性(容错)分布式数据集,是一个逻辑上的概念,实际上没有数据,是Spark中最基本的数据抽象。它代表一个不可变,可分区,元素能够用于并行计算的的集合。该类包含所有rdd上可用的基本操作,如:”map”, ”filter”****。 什么是弹性: \1. RDD可以再内存
相关文章
相关标签/搜索