Spark集群安装方式2

时间 2019-12-10

标签 spark 集群安装方式栏目 Spark 繁體版

原文原文链接

环境: jdk1.八、hadoop-2.七、spark-1.六、三台centos7(以下List-1所示)node

List-1 以下30上部署master;31上部署worker1;32上部署worker2apache

192.168.33.30 master
192.168.33.31 worker1
192.168.33.32 worker2

将jdk1.八、hadoop-2.七、spark-1.6文件夹放到三台机器的/opt下centos

修改spark的conf下的spark-env.sh文件(若是不存在，则cp spark-env.sh.template spark-env.sh)，修改成以下List-2，这个修改三台机器上都要作:bash

List-2oop

export JAVA_HOME=/opt/jdk1.8
export SPARK_DIST_CLASSPATH=$(/opt/hadoop-2.7.7/bin/hadoop classpath);

为何List-2中须要将hadoop的classpath加入到其中，是由于spark自1.4以后，编译都是没有将hadoop的classpath编译进去的，因此必须在spark-env.sh中指定hadoop中的全部jar包。url

在master机器上，spark安装目录，执行以下，以后在控制台就会打印出一些日志，从日志中能够看到master url和MasterWebUIcentos7

List-3spa

/bin/spark-class org.apache.spark.deploy.master.Master

在worker1/worker2，spark安装目录，执行以下，以后看MasterWebUI就会看到worker加入进去了日志

List-4code

/bin/spark-class org.apache.spark.deploy.worker.Worker spark://192.168.33.30:7077

到此咱们的集群启动完成了。

接下来介绍另外一种启动方式：

在master的spark安装目录下，执行以下，查看日志/opt/spark-mjduan/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.out，能够看到master url和masterWebUrl:

List-5

[root@master spark-mjduan]# sbin/start-master.sh 
starting org.apache.spark.deploy.master.Master, logging to /opt/spark-mjduan/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.out

在workerr1/worker2上，spark安装目录，执行以下:

List-6

[root@node2 spark-mjduan]# sbin/start-slave.sh spark://192.168.33.30:7077
starting org.apache.spark.deploy.worker.Worker, logging to /opt/spark-mjduan/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-node2.out

以后看masterWebUrl，能够看到集群信息了。