Spark性能优化总结

总结一下我的看了一些Spark性能调优文章以后的理解,主要框架来自于meituantech,会在此框架上加入我的关注点,目录以下,html 0. Overview 1. 开发调优 - 避免建立重复的RDD - 尽量复用同一个RDD - 对屡次使用的RDD进行持久化 - 尽可能避免使用shuffle类算子 - 使用map-side预聚合的shuffle操做 - 使
相关文章
相关标签/搜索