Spark----关于数据倾斜

如何定位数据倾斜 数据倾斜通常会发生在shuffle过程当中。很大程度上是你使用了可能会触发shuffle操做的算子:distinct、groupByKey、reduceByKey、aggregateByKey、join、cogroup、repartition等。sql spark 调优: 调优工具: 一、Spark Web UI       Spark内置应用运行监控工具 二、Ganglia  
相关文章
相关标签/搜索