spark优化要点(开发)

背景 为何须要调优?? 程序都是能跑的,集群仍是那个集群,可是有可能另一个会调优的人和你写的代码的运行的速度要几倍甚至几十倍javascript 1.开发调优 1.1 原则一:避免建立重复的RDD 咱们有一份数据 ,student.txt 第一个需求 :wordCount val stuRDD = sc.textFile(“e://sparkData//student.txt”) 第二个需求:算有
相关文章
相关标签/搜索