Spark学习-一文了解RDD

什么是RDD RDD(Resilient Distributed Dataset)弹性分布式数据集,RDD从字面理解,分为三个层面:弹性、分布式、数据集。web RDD是一种数据集,是Spark对于要处理的数据的抽象,就像Java等高级编程语言中的List、HashMap等集合;编程 分布式是由于咱们一般是以集群形式进行分布式计算,RDD中的数据并不是存在一个节点,而是分布于集群各个节点,便于调用
相关文章
相关标签/搜索