必读|spark的重分区及排序

前几天,有人在星球里,问了一个有趣的算子,也便是RepartitionAndSortWithinPartitions。当时浪尖也在星球里讲了一下,整个关于分区排序的内容。今天,在这里给你们分享一下。apache 昨天说了,mapPartitions 的使用技巧。你们应该都知道mapPartitions值针对整个分区执行map操做。并且对于PairRDD的分区默认是基于hdfs的物理块,固然不可分割
相关文章
相关标签/搜索