spark学习-Spark性能调优手段

Spark性能调优手段:java 判断内存消耗:设置RDD并行度,将RDD cache到内存,经过BlockManagerMasterActor添加RDD到memory中的日志查看每一个partition占了多少内存,最后乘以partition数量,便是RDD内存占用量。json 1.Shuffle调优(核心)数组 a.consolidation机制,使shuffleMapTask端写磁盘的文件数
相关文章
相关标签/搜索