Spark 算子

==> RDD是什么?     ---> RDD(Resilient Distributed Dataset) 弹性分布式数据集 , 是 Spark 中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可并行计算的集合     ---> 特点:         ---- 自动容错         ---- 位置感知性高度         ---- 可伸缩性         ---- 允许用户在
相关文章
相关标签/搜索