六、Spark性能调优——算子调优

目录 一、mapPartition 二、freachPartition优化数据库操作 三、filter 与 coalesce结合 四、repartition 解决 SparkSQL 低并行度问题 五、reduceByKey 本地聚合 一、mapPartition 普通的 map 算子对 RDD 中的每一个元素进行操作, 而 mapPartitions 算子对 RDD中每一个分区进行操作。 如果是普
相关文章
相关标签/搜索