六、Spark性能调优——算子调优

时间 2021-07-11

原文原文链接

目录一、mapPartition 二、freachPartition优化数据库操作三、filter 与 coalesce结合四、repartition 解决 SparkSQL 低并行度问题五、reduceByKey 本地聚合一、mapPartition 普通的 map 算子对 RDD 中的每一个元素进行操作，而 mapPartitions 算子对 RDD中每一个分区进行操作。如果是普