基于Kubernetes的Spark集群部署实践

时间 2019-12-06

标签基于 kubernetes spark 集群部署实践栏目 Spark 繁體版

原文原文链接

Spark是新一代分布式内存计算框架，Apache开源的顶级项目。相比于Hadoop Map-Reduce计算框架，Spark将中间计算结果保留在内存中，速度提高10~100倍；同时它还提供更丰富的算子，采用弹性分布式数据集(RDD)实现迭代计算，更好地适用于数据挖掘、机器学习算法，极大提高开发效率。node Docker是轻量级虚拟化容器技术，具备轻便性、隔离性、一致性等特色，能够极大简

>>阅读原文<<