sparkRDD:第3节 RDD经常使用的算子操做

4.      RDD编程API 4.1 RDD的算子分类        Transformation(转换):根据数据集建立一个新的数据集,计算后返回一个新RDD;例如:一个rdd进行map操做后生了一个新的rdd。html Action(动做):对rdd结果计算后返回一个数值value给驱动程序,或者把结果存储到外部存储系统(例如HDFS)中;node 例如:collect算子将数据集的全部元
相关文章
相关标签/搜索