Spark调优（数据序列化和内存调优）

时间 2019-12-05

标签 spark 数据序列内存栏目 Spark 繁體版

原文原文链接

翻译自Spark官网文档：https://spark.apache.org/docs/2.1.0/tuning.htmlhtml 前言因为大多数Spark计算的内存使用特性，集群中的任何资源均可能成为Spark计算程序中的瓶颈：CPU，网络带宽或是内存。大多数状况下，若是内存能够容纳数据量，那么瓶颈就会是网络带宽，但有时，用户也须要去作一点调优的工做，例如以序列化的格式存储RDD，来减小

>>阅读原文<<