spark的优化

1.Spark性能优化技术 Spark的性能优化,主要手段包括: 1、使用高性能序列化类库 2、优化数据结构 3、对多次使用的RDD进行持久化 / Checkpoint 4、使用序列化的持久化级别 5、Java虚拟机垃圾回收调优 6、提高并行度 7、广播共享数据 8、数据本地化 9、reduceByKey和groupByKey的合理使用 10、Shuffle调优(核心中的核心,重中之重) Spar
相关文章
相关标签/搜索