Spark 2.0分布式集群环境搭建

Apache Spark 是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。Spark 最大的特色就是快,可比 Hadoop MapReduce 的处理速度快 100 倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群,而是使用三台电脑来搭建一个小型分布式集群环境安装。 本教程采用Spark2.0以上版本(好比Spark2.0.二、Spark2.1.0等)搭建集群,一样适用于搭建Spa
相关文章
相关标签/搜索