Spark Core 核心RDD

1、 RDD是一个抽象类,带泛型的,可以支持多种类型,String、Person、User… 2、RDD : Resilient Distributed Dataset 弹性 分布式 数据集 是spark里面最基本的一个抽象的单元,是一个不可变的数据集分区的并行计算 3、 什么是Resilient 弹性:spark 作为一个和mapreduce类似的计算框架,能做到分布式节点挂掉或者某个数据节点丢
相关文章
相关标签/搜索