spark 优化算子选择

摘要html    1.使用reduceByKey/aggregateByKey替代groupByKey   2.使用mapPartitions替代普通map   3.使用foreachPartitions替代foreach   4.使用filter以后进行coalesce操做   5.使用repartitionAndSortWithinPartitions替代repartition与sort类操
相关文章
相关标签/搜索