Spark-RDD简介以及算子实例

                              Spark-RDD简介以及算子实例 1、RDD概述 1.1 什么是RDD?es6 RDD(Resilient Distribute Dataset)叫作分布式数据集。式Spark最基本的数据抽象。apache 它表明一个不可变,可分区,里面的元素可并行计算的集合。centos RDD具备数据流模型的特色:自动容错、位置感应性调度和可伸缩性
相关文章
相关标签/搜索