Spark Core(十九)Spark性能的调优

资源调优 就是多分配内存和core 更改高效的序列化方法,kyro(减少内存开销) 优化数据结构(减少内存开销) 优先使用数组,而不是集合类。优先使用字符串。尽可能少的使用包装类. 业务允许的情况下尽量使用id作为唯一键,不用String类型 尽量少用对象嵌套结构,可以用Json串来代替对象嵌套结构 对RDD进行持久化与Checkpoint 如果一个RDD被多次进行Action操作和Transfo
相关文章
相关标签/搜索