Spark性能优化指南学习(四)——spark内存模型及shuffle调优

一、内存模型 spark运行使用内存主要包含driver和executor,通过driver-memory和executor-memory进行设置,通过运行机制得知,driver负责提交注册,接受executor反向注册,stage划分和task任务分发等工作,默认内存大小为1G,在使用collect算子时,需要注意oom,因为collect算子将数据拉取到driver,spark的主要作业发生在
相关文章
相关标签/搜索