spark2.x-官方调优指南(翻译)

原文html http://spark.apache.org/docs/latest/tuning.htmljava 序列化git 序列化在任何分布式应用程序的性能中起着重要的做用。 将对象序列化到或消耗大量字节的格式将大大减慢计算速度。spark 提供了两个序列化库:github Java serialization: 默认状况下,spark使用java对象序列化机制 https://docs.
相关文章
相关标签/搜索