Spark源码系列之foreach和foreachPartition的区别

一,基本使用 1,RDD分布式数据集的五大特性 1),A list of partitions(一系列的分区) 2),A function for computing each split(计算每个分片的方法) 3),A list of dependencies on other RDDs(一系列的依赖RDD) 4),Optionally, a Partitioner for key-value
相关文章
相关标签/搜索