Spark集群-Standalone 模式

时间 2019-11-13

原文原文链接

Spark 集群相关

来源于官方, 能够理解为是官方译文, 外加一点本身的理解. 版本是2.4.4html

本篇文章涉及到:node

集群概述
master, worker, driver, executor的理解
打包提交,发布 Spark application
standalone模式
- SparkCluster 启动及相关配置
- 资源, executor分配
- 开放网络端口
- 高可用(Zookeeper)

名词解释

Term（术语）	Meaning（含义）
Application	用户构建在 Spark 上的程序。由集群上的一个 driver 程序和多个 executor 组成。
Driver program	该进程运行应用的 main() 方法而且建立了 SparkContext。
Cluster manager	一个外部的用于获取集群上资源的服务。（例如，Standlone Manager，Mesos，YARN）
Worker node	任何在集群中能够运行应用代码的节点。
Executor	一个为了在 worker 节点上的应用而启动的进程，它运行 task 而且将数据保持在内存中或者硬盘存储。每一个应用有它本身的 Executor。
Task	一个将要被发送到 Executor 中的工做单元。
Job	一个由多个任务组成的并行计算，而且能从 Spark action 中获取响应（例如 save，collect）; 您将在 driver 的日志中看到这个术语。
Stage	每一个 Job 被拆分红更小的被称做 stage（阶段）的 task（任务）组，stage 彼此之间是相互依赖的（与 MapReduce 中的 map 和 reduce stage 类似）。您将在 driver 的日志中看到这个术语。

概述

参考连接: Cluster Mode Overviewweb

中文连接: 集群模式概述shell

Spark Application 在集群上做为独立的进程组来运行，在 main程序(称之为 driver 程序）中经过 SparkContext 来协调。apache

具体来讲，为了运行在集群上，SparkContext 能够链接至几种类型的 Cluster Manager（既能够用 Spark 本身的 Standlone Cluster Manager，或者 Mesos，也可使用 YARN），用以在 applications 之间分配资源。浏览器

一旦链接上，Spark 得到集群中节点上的 Executor，这些进程能够运行计算而且为应用存储数据。缓存

接下来，它将发送 application 的代码（经过 JAR 或者 Python 文件定义传递给 SparkContext）至 Executor。而这一点大概也是在 work目录下, 每一个application中都有对应的 jar包的缘由. 最终，SparkContext 将发送 Task 到 Executor 以运行。安全

有这么几点要注意的地方:网络

每一个application拥有它自身的 executor 进程. 它们会保持在整个 application 的生命周期中而且在多个线程中运行 task. 这样作的优势是能够将 application 之间相互隔离, 不管是在任务调度层面(即driver, driver 负责任务调度.) 又或者是 executor的层面. 这意味着若是没有外部存储机制, 各个 application之间是没法进行数据共享的.并发
Spark并不关心到底是基于怎样的集群模式, 它只关心可以获取自身的 executor进程, 而且彼此之间能够相互通讯便可.
Driver 程序必须在本身的生命周期内监听和接受来自它的 Executor 的链接请求。（配置: spark.driver.port) 一样的，对于 worker node 而言, driver 程序也必须可以从网络中链接到.
由于 driver 负责在整个集群上调度任务，所以可以与 worker node 处于同一局域网下是更优的选择(不然的话, 网络通讯可能就成为了整个Spark最大的时间开销)。若是你不喜欢发送请求到远程的集群，倒不如打开一个 RPC 至 driver 并让它就近提交操做而不是从很远的节点上运行一个 driver。

在这里解决这样一个比较问题: master, worker, driver, executor之间是什么样的关系?

能够参考:

Spark中master、worker、executor和driver的关系

Spark源码之Master

上面的博客是我看了几篇以后, 以为描述的比较准确的.

那么一点点来讲: spark的application 运行须要一个环境, 也即spark自己.

而每每咱们使用的就是集群环境, 集群环境中有多台机器, 多个进程, 这就须要一个管理器, 管理多个master 和多个 worker节点. 这个就是 cluster manager. 而咱们直接通讯的对象, 也就是 application 直接通讯的对象就是 master. 由master 来告诉咱们 application 的可用资源在哪里.

一个集群中, 能够运行多个application.

当咱们提交application以后, 会接入master, master分配给咱们资源, 也即executor, main程序所在的进程. 就被称做是 driver. driver 分配任务, 协调各个executor, 运行各个 task的就是 executor.

注意在这里并无指定driver究竟会运行在哪一个节点上.

与选取的模式有关.

而master呢? 在master中注册 application, driver, worker这三种资源, 而 executor资源是注册在 driver中的, 新的worker加入, driver状态变化, worker状态变化都会通告给 master 以从新协调资源.

咱们会发现, executor在分配以后是与master无关的, 程序是运行在executor中的, driver并不必定运行在master中, 所以即便master挂掉, 程序也并非就不可以运行了.

master worker是集群中的物理资源分配, driver , executor 是对物理资源的使用. 在申请新的资源时, 须要向master申请, 在任务调度运行时, 则无需向master通报.

其实仔细想一想, 在大多数集群的处理中, 都是采用这种模式, cluster manager负责集群的资源管理, 相互通讯, master节点负责资源调度, 资源状态变动处理, 而 application 是独立于它们运行的, 一旦获取到本身须要的资源, 就不和master进行通讯了.

Cluster Manager 类型

系统目前支持三种 Cluster Manager:

Standalone – 包含在 Spark 中, 简单易使用。

Apache Mesos – 一个通用的 Cluster Manager，它也能够运行 Hadoop MapReduce 和其它服务应用。

Hadoop YARN – Hadoop 2 中的 resource manager（资源管理器）。

Kubernetes (experimental)

Nomad: 存在第三方的项目(并不是受到Spark项目支持的) 能够添加对应的集群支持.

提交应用程序

官方连接: Submitting Applications

中文连接: Submitting Applications

在 Spark的 bin 目录中的spark-submit 脚本用于在集群上启动应用程序。它能够经过一个统一的接口使用全部 Spark 支持的 cluster managers，因此您不须要专门的为每一个cluster managers配置您的应用程序。

打包

打包的时候, 须要将程序自身的jar与程序的依赖jar一块儿进行打包, 这一点能够经过maven 的 shade / assembly 来实现. 在项目中将 spark 和 hadoop 的包范围权限定义为 provided便可.它们不须要被打包，由于在运行时它们已经被 Cluster Manager 提供了.

启动

打包完成以后, 就能够经过 bin/spark-submit 进行提交了.

这个脚本负责设置 Spark 和它的依赖的 classpath，而且能够支持 Spark 所支持的不一样的 Cluster Manager 以及 deploy mode（部署模式）:

./bin/spark-submit \
--class <main-class> \
--master <master-url> \
--deploy-mode <deploy-mode> \
--conf <key>=<value> \
... # other options
<application-jar> \
[application-arguments]

经常使用的参数有:

--class：您的应用程序的入口点（例如 org.apache.spark.examples.SparkPi)
--master：集群的 master URL（例如 spark://23.195.26.187:7077）
--deploy-mode：是在 worker 节点（cluster）上仍是在本地做为一个外部的客户端（client）部署您的 driver（默认：client）
--conf：按照 key=value 格式任意的 Spark 配置属性。对于包含空格的 value（值）使用引号包 “key=value” 起来。
application-jar：包括您的应用以及全部依赖的一个打包的 Jar 的路径。该 URL 在您的集群上必须是全局可见的，例如，一个 hdfs:// path 或者一个 file:// 在全部节点是可见的。
application-arguments：传递到您的 main class 的 main 方法的参数，若是有的话。

其中参数顺序并无严格要求, 但要求 jar路径必须在倒数第二或最后一个参数位置(若是不经过 application-jar 来指定的话).

有一些特定于所使用的集群管理器的可用选项。例如，对于具备部署模式的Spark standalone Cluster，您还能够指定--supervise以确保驱动程序在非零退出代码失败的状况下自动从新启动。要枚举全部可用的此类选项，请使用来spark-submit运行它--help.

其中 StandaloneCluster的可配置参数在稍后会有所说明.

Master URLS

Master URL	Meaning
local	使用一个线程本地运行 Spark（即，没有并行性）。
local[ K ]	使用 K 个 worker 线程在本地运行 Spark（理想状况下，设置这个值的数量为你的机器的 core 数量）。
local[K, F]	使用 K 个 worker 线程本地运行 Spark并容许最多失败 F次（对于任意job失败会进行重试, 重试次数等 F - 1)
local[ * ]	使用与机器的逻辑 core数量相等的 worker线程.
local[*, F]	使用与机器的逻辑 core数量相等的 worker线程. 并容许最多失败 F次。
spark://HOST:PORT	链接至给定的 Spark standalone cluster master. master。该 port（端口）必须有一个做为您的 master 配置来使用，默认是 7077。
spark://HOST1:PORT1,HOST2:PORT2	链接至给定的 Spark standalone cluster with standby masters with Zookeeper。该列表必须包含由zookeeper设置的高可用集群中的全部master主机。该 port（端口）必须有一个做为您的 master 配置来使用，默认是 7077。
mesos://HOST:PORT	链接至给定的 Mesos 集群。该 port（端口）必须有一个做为您的配置来使用，默认是 5050。或者，对于使用了 ZooKeeper 的 Mesos cluster 来讲，使用 mesos://zk://...。使用 --deploy-mode cluster，来提交，该 HOST:PORT 应该被配置以链接到 MesosClusterDispatcher。
yarn	以 client 或 cluster 模式链接至一个 YARN cluster, 模式取决于 --deploy-mode. 该 cluster 的位置将根据 HADOOP_CONF_DIR 或者 YARN_CONF_DIR 变量来找到。
k8s://HOST:PORT	以集群模式链接至 k8s 集群, 在目前版本不支持设定客户端模式(在未来会提供), HOST PORT 指向对应 k8s API服务, 默认使用 TSL链接. 若是不想使用 TSL, 须要强制指定 k8s://http://HOST:PORT.

配置

spark-submit 脚本能够从一个 properties 文件加载默认的 Spark configuration values。默认状况下，它将从 Spark 目录下的 conf/spark-defaults.conf 读取配置.

加载默认的 Spark 配置，能够在提交时省略一部分参数, 例如，若是 spark.master 属性被设置了，您能够在 spark-submit 中安全的省略 --master 配置. 通常状况下，明确设置在 SparkConf 上的配置值的优先级最高，而后是传递给 spark-submit的值，最后才是 default value（默认文件）中的值。

若是你不是很清楚其中的配置设置来自哪里，您能够经过使用 --verbose 选项来运行 spark-submit 打印出细粒度的调试信息.

高级依赖管理

并不是只有把全部的须要的jar包都打包在一块儿这一种方式.

经过 --jars 选项包括的应用程序的 jar 和任何其它的 jar 都将被自动的传输到集群. --jars 后面提供的 URL 必须用逗号分隔。该列表会被包含到 driver 和 executor 的 classpath 中。 --jars 不支持目录的形式。

URL有如下几种方式:

file: 绝对路径和 file:/ URI 经过 driver 的 HTTP file server 提供服务，而且每一个 executor 会从 driver 的 HTTP server 拉取这些文件。
hdfs:, http:, https:, ftp: 指定下载文件的 URI.
local: 一个用 local:/ 开头的 URL, 要求做在每一个 worker 节点上都存在。这样意味着没有网络 IO 发生，而且很是适用于那些已经被推送到每一个 worker 或经过 NFS，GlusterFS 等共享的大型的 file/JAR。

注意: JARS 和 files 被复制到每一个SparkContext 的 executor 节点的工做目录. 在长时间的运行中, 所须要的空间会逐渐加大, 所以去清理掉这些文件. 在 YARN 模式下, 能够自动清理文件, 而在 standalone模式下, 须要在配置中加入spark.worker.cleanup.appDataTtl 用以自动清理.

Standalone 模式

官方文档: Spark Standalone Mode

中文文档: Spark Standalone Mode

因为在咱们目前的项目中, 采用的就是 standalone模式, 所以只介绍这一种模式.

Spark 提供了一个简单的 standalone 部署模式。你能够手动启动 master 和 worker 来启动 standalone 集群.

安装 Spark Standalone 集群，只须要将编译好的版本部署在集群中的每一个节点上。

先回答一个问题:

在当前模式下, driver 是选取几个worker中的一个来运行相关进程, 并不是是在master节点.

启动Spark Cluster

一般来讲, 我使用的启动命令为:

${SPARK_HOME}/sbin/start-all.sh

会加载配置文件, 启动 spark master, spark slaves.

中止的时候, 也能够采用 stop-all.sh

注意: 这些脚本必须在您想要运行 Spark master 的机器上执行，而不是您本地的机器。

固然能够加入一部分配置文件, 指定参数配置:

比较重要的或有趣的我会标注出来.

conf/spark-env.sh

能够在复制 conf/spark-env.sh.template > spark-env.sh 中设置环境变量来进一步配置集群。

可接收参数有:

环境变量	含义
SPARK_MASTER_HOST	绑定 master 到一个指定的 hostname 或者 IP 地址
SPARK_MASTER_PORT	在不一样的端口上启动 master（默认：7077）
SPARK_MASTER_WEBUI_PORT	master的 web ui (默认: 8080)
SPARK_MASTER_OPTS	仅应用到 master 上的配置属性，格式是 "-Dx=y"（默认是：none）, 可用参数在下面会提到.
SPARK_LOCAL_DIRS	Spark 中 "scratch" space（暂存空间）的目录，包括 map 的输出文件和存储在磁盘上的 RDDs, 咱们知道内存溢出会根据策略, 有可能存储在磁盘上. 这必须在你的系统中的一个快速的(不太明白这个快速的, 是什么意思?)，本地的磁盘上。这也能够是逗号分隔的不一样磁盘上的多个目录的列表。
SPARK_WORKER_CORES	机器上全部 Spark 应用程序可使用的的 cores 的总数.（默认：所有的核可用）
SPARK_WORKER_MEMORY	机器上的全部的 spark applications 容许使用的总的内存, 默认是机器内存 - 1GB; 而单个application的内存配置是由 spark.executor.memory 所决定的.
SPARK_WORKER_PORT	spark worker的端口, 默认是随机
SPARK_WORKER_WEBUI_PORT	spark worker 的 web ui 端口, 默认是 (8081)
SPARK_WORKER_DIR	运行application所在的路径, 这个目录中包含日志和暂存空间（default：SPARK_HOME/work）
SPARK_WORKER_OPTS	与 SPARK_MASTER_OPTS 相似, 不过是应用于 worker
SPARK_DAEMON_MEMORY	分配给 Spark master 和 worker 守护进程的内存。（默认： 1g）
SPARK_DAEMON_JAVA_OPTS	Spark master 和 worker 守护进程的 JVM 选项，格式是 "-Dx=y"（默认：none）
SPARK_DAEMON_CLASSPATH	Spark master 和 worker 守护进程的 classPath (default: none).
SPARK_PUBLIC_DNS	Spark master 和 worker 的公开 DNS 名称(不是很理解)。（默认：none）

注意：启动脚本如今还不支持 Windows。要在 Windows 上运行一个 Spark 集群，须要手动启动 master 和 workers。

可是不知为什么, 我在运行 start-all的时候, 出现了 master 已经启动, 但 worker不能启动的问题.

最终的解决方式是将在 Spark-env.sh中加入

export JAVA_HOME=$JAVA_PATH

才解决的这个问题, 所以 Spark-env.sh 不只可以用来容纳所上述所提供的部分参数, 还可以指定, 提供Spark所须要的环境变量, 如 JAVA_HOME, SCALA_HOME, PYTHON_HOME 等等.

SPARK_MASTER_OPTS 参数

属性名	默认值	含义
spark.deploy.retainedApplications	200	在 web ui上最大展现的已经完成的 application数量. 超过限制的会被从UI中丢弃.
spark.deploy.retainedDrivers	200	展现已完成的 drivers 的最大数量。旧的 driver 会从 UI 删除掉以知足限制。
spark.deploy.spreadOut	true	cluster mananger 是否将多个 application 分配到不一样的节点上仍是尽可能使用越少的节点越好(即整合操做). 默认true是分配到不一样节点上. 对于数据在本地的 HDFS 文件中, 通常是尽可能分离会比较好, 而对于计算密集型任务来讲, 使用尽可能少的节点是一种更好的选择.
spark.deploy.defaultCores	(infinite)	若是没有设置 spark.cores.max，在 Spark 的 standalone 模式下默认分配给应用程序的 cores（核）数。若是没有设置，application 将老是得到全部的可用核，除非application设置了 spark.cores.max。在共享集群中设置较低的核数，可用于防止用户 grabbing（抓取）整个集群.
spark.deploy.maxExecutorRetries	10	executor 连续屡次的最大失败次数, 一旦到达最大次数, cluster manager 将会移除发生错误的 application. 若是 application 有任意正在运行的 executor 则永远不会移除. 若是一个应用程序经历过超过 spark.deploy.maxExecutorRetries 次的连续失败，在这期间没有executor成功开始运行，而且应用程序没有运行着的executor，而后 cluster manager 将会移除这个应用程序并将它标记为失败。若是要禁用功能的话, 设置为-1便可.
spark.worker.timeout	60	master 接收 worker 心跳的最大时间间隔, 单位秒.

SPARK_WORKER_OPTS 参数

属性名	默认值	含义
spark.worker.cleanup.enabled	false	容许按期清理 worker / application 目录. 仅在standalone模式有效,且仅对已经中止运行的 application有效.
spark.worker.cleanup.interval	1800 (30 minutes)	在本地机器上，多久去检测并清理一次，以秒计数.
spark.worker.cleanup.appDataTtl	604800 (7 days, 7 * 24 * 3600)	对于每个worker, 容许目录存在的最大时间, 这应该取决于你磁盘可分配的最大空间. 随着时间的推移, 这个工做目录会很快填满磁盘空间, 特别是若是您常常运行jobs.
spark.storage.cleanupFilesAfterExecutorExit	true	在executor退出以后自动清除工做目录下的 non-shuffle 文件(例如: 临时文件, shuffle blocks, 缓存的 RDD/broadcast blocks, spill files, 等等) of worker directories following executor exits. 注意与 spark.worker.cleanup.enabled 是不一样的. 后者会清理全部超时的项目文件.仅在 standalone模式下有效.
spark.worker.ui.compressedLogFileLengthCacheSize	100	对于压缩日志文件，只能经过未压缩文件来计算未压缩文件。Spark 缓存未压缩日志文件的文件大小。此属性控制缓存的大小.

要在 Spark 集群中运行一个应用程序，只须要简单地将 master 的 spark://IP:PORT URL.

要针对集群运行交互式 Spark shell，运行下面的命令：
```
./bin/spark-shell --master spark://IP:PORT
```
能够经过指定 --total-executor-cores numCores 控制集群中使用的总的 cores数量.

提交application

对于 standalone 集群, park 目前支持两种部署模式。在 client 模式下，driver 在与 client 提交应用程序相同的进程中启动。

在 cluster 模式下，driver 是集群中的某个 Worker 中的进程中启动，而且 client 进程将会在完成提交应用程序的任务以后退出，而不须要等待应用程序完成再退出。

若是应用程序是经过 Spark submit, application 会被自动发送到全部的工做节点, 对于你所依赖的任何jar包, 能够经过 --jars 的方式传入, 多个jar之间用,分割. 但正如以前高级依赖管理中提到的, 并不支持目录形式.

standalone cluster 模式支持自动重启 application, 若是程序是以非零代码退出的话. 只须要在 submit的时候加入 --supervise 标识便可.若是您想杀死一个重复失败的应用程序，您可使用以下方式：

./bin/spark-class org.apache.spark.deploy.Client kill <master url> <driver ID>

资源分配

standalone 集群模式当前只支持一个简单的跨应用程序的 FIFO 调度。然而，为了容许多个并发的用户，您能够控制每一个应用程序能用的最大资源数。默认状况下，它将获取集群中的 all cores（核），这只有在某一时刻只容许一个应用程序运行时才有意义, 由于若是此时其余的核被占用, 天然没法获取资源, 运行程序, 此时是有多少核用多少核.

您能够经过 spark.cores.max 在 SparkConf 中设置 cores（核）的数量。例如：

val conf = new SparkConf()
.setMaster(...)
.setAppName(...)
.set("spark.cores.max", "10")
val sc = new SparkContext(conf)

这样就不用担忧一个application占用了集群全部的资源, 又由于在 FIFO 模式下, 致使其余application没法使用.

此外, 若是不想经过 spark.cores.max,也能够经过在集群的 master 进程中配置 spark.deploy.defaultCores 来修改的应用程序。经过添加下面的命令到 conf/spark-env.sh：

export SPARK_MASTER_OPTS="-Dspark.deploy.defaultCores=$value"

executor分配

每一个executor的可以使用核心数是可配置的, 当 spark.executor.cores 被设置以后, 同一application的多个 executors 可能在同一台机器上运行, 在机器的 core 和 memory 资源充足的状况下.

不然每一个executor 会获取全部的可用 core, 固然和资源分配中提到的一致, 这须要在每次任务调度期间, 每一个worker上的单个 application 只有一个 executor.

监控 & 日志

监控天然是:

SPARK_MASTER_WEBUI_PORT 默认8080

SPARK_WORKER_WEBUI_PORT 默认8081, 若是8081已经被占用, 则会顺延一位.

分别对应 master的web ui 和 worker的web ui

至于日志则是在各个节点的 worker目录.

配置网络安全端口

一般来讲, 一个 spark cluster 和其服务并不会放在公共网络上, 通常都运行在私有服务内, 而且只能在部署Spark的组织网络内访问.

对Spark服务使用的主机和端口的访问应仅限于须要访问服务的原始主机.

这对于standalone来讲更为重要, 由于这种模式并不支持自由的网络资源控制.

能够参考连接:

端口配置

一样的关键部分, 与外界交互的端口, 用特殊颜色标注:

起始地址	目标地址	默认端口	用户	配置	说明
浏览器	standalone master	8080	WEBUI	spark.master.ui.port / SPARK_MASTER_WEBUI_PORT	仅在 standalone模式使用
浏览器	standalone Worker	8081	Web UI	spark.worker.ui.port	SPARK_WORKER_WEBUI_PORT
Driver / Standalone Worker	Standalone Master	7077	driver提交任务到 cluster/worker加入 cluster Submit job to cluster	SPARK_MASTER_PORT
外部服务	Standalone Master	6066	经过 REST API的方式提交任务到集群中.	spark.master.rest.port	须要spark.master.rest.enabled 设置为 enabled. 仅在集群模式下使用.
Standalone Master	Standalone Worker	(random)	调度分配 executors	SPARK_WORKER_PORT	设置为0则二十随机端口. 仅在 standalone模式下使用.
浏览器	application	4040	WebUI	spark.ui.port
浏览器	历史服务: Spark学习笔记-使用Spark History Server	18080	Web UI	spark.history.ui.port	全部模式
Executor / Standalone Master	Driver	(random)	链接到 application 或发现 executor状态变动	spark.driver.port	设置为0便是随机端口, 全部模式可用.
Executor / Driver	Executor / Driver	(random)	Block Manager 端口	spark.blockManager.port	经过 ServerSocketChannelRaw socket

高可用

通常来讲, standalone 集群调度对于 worker的失败都是有必定弹性的(会将失去链接的worker从 worker中移除, 并将任务分配给其余worker.) 然而, 调度器使用的是 master去进行调度决策, 而且（默认状况下）会产生一个单点故障: 若是master 一旦崩溃, 则不会有任何 application 可以被建立, 为了规避这一点, 有以下两个高可用性方案:

Zookeeper

使用zk提供 leader的选举和存储一些状态. 咱们能够经过启动多个masters 并链接到同一个 Zookeeper, 其中一个master会被选举为 leader, 其余的节点会维持在备用状态, 若是当前leader宕机, 则会从备份中选取一个master做为 leader, 恢复master状态, 并恢复调度. 从master宕机开始到另外一个master恢复启用, 应该会用1~2分钟的时间.

注意这种延迟仅仅会影响调度新的 application, 在master挂掉期间, 正在运行的application是不受影响的.

配置:

为了启用这个恢复模式，您能够在 spark-env 中设置 SPARK_DAEMON_JAVA_OPTS 经过配置 spark.deploy.recoveryMode 和相关的 spark.deploy.zookeeper.* 配置。

配置链接: zk配置

内容以下:

属性名称	默认值	含义
spark.deploy.recoveryMode	NONE	恢复模式设置，用于在失败并从新启动时以集群模式恢复提交的Spark做业。这仅适用于与Standalone或Mesos一块儿运行的群集模式。
spark.deploy.zookeeper.url	NONE	当spark.deploy.recoveryMode设置为ZOOKEEPER时，此配置用于设置要链接的Zookeeper URL.
spark.deploy.zookeeper.dir	NONE	当spark.deploy.recoveryMode设置为ZOOKEEPER时，此配置用于设置zookeeper 存储状态的目录.

当你已经加入了ZK的相关配置以后, 实现高可用就是一件很简单的事, 只须要启动在多个节点上启动多个 master进程配置同一个zk(包括url 和目录.), 能够在任意时间添加或移除 master.

为了添加新的 application 或加入新的 worker节点, 咱们须要知道当前leader的地址.这能够经过简单地传递一个你在一个单一的进程中传递的 Masters 的列表来完成。

如:

spark://host1:port1, host2:port2, host3:port3

经过这种方式就能够将全部的master注册给 SparkContext了, 若是一个host挂掉, 经过这种方式就能够正确的找到 leader2.

在使用 Master 注册与正常操做之间有一个重要的区别。当启动的时候，一个 application 或者 Worker 须要找到当前的 lead Master 并注册.一旦它成功注册，它就是 “在系统中” 了（即存储在了 ZooKeeper 中）。若是发生故障切换，新的 leader 将会联系全部以前已经注册的应用程序和 Workers 来通知他们领导层的变化，因此他们甚至不知道新的 Master 在启动时是不是否存在.

经过这个属性, 新的master能够在任什么时候候被建立, 因此你惟一须要担忧的是, 新的application 和 worker 可以找到它, 假设它成为了新的leader. 一旦成功注册, 你就不须要担忧了.

本地文件的方式

Zookeeper是最佳方式, 所以我就再也不这里介绍另外一种方式了.

这种方式的目的是, 你仅仅只是想要在 master 挂掉以后, 重启master.

Single-Node Recovery with Local File System 的最后一部分.