基于Kubernetes的Spark集群部署和测试

基于Kubernetes的Spark集群部署和测试 1、构建Docker镜像 2、在Kubernetes上建立Spark集群 3、测试Spark的一个简单应用   Spark是新一代分布式内存计算框架,Apache开源的顶级项目。相比于Hadoop Map-Reduce计算框架,Spark将中间计算结果保留在内存中,速度提高10~100倍;同时它还提供更丰富的算子,采用弹性分布式数据集(RDD)实
相关文章
相关标签/搜索