SparkSQL性能调优与优化指南

时间 2019-12-05

原文原文链接

spark 内存泄露 1.高并发状况下的内存泄露的具体表现很遗憾，Spark的设计架构并非为了高并发请求而设计的，咱们尝试在网络条件很差的集群下，进行100并发的查询，在压测3天后发现了内存泄露。node a)在进行大量小SQL的压测过程当中发现，有大量的activejob在spark ui上一直处于pending状态，且永远不结束，以下图所示sql b)而且发现driver内存爆满apac

>>阅读原文<<