【Spark亚太研究院系列丛书】Spark实战高手之路-第一章构建Spark集群（第二步）（4）

时间 2019-11-06

标签 Spark亚太研究院系列丛书 spark 实战高手之路第一章构建集群二步栏目 Spark 繁體版

原文原文链接

4.测试Hadoop分布式集群环境；

首先在经过Master节点格式化集群的文件系统：node

输入“Y”完成格式化：web

格式化完成之后，咱们启动hadoop集群分布式

咱们在尝试一下中止Hadoop集群：oop

此时出现了“no datanode to stop”的错误，出现这种错误的缘由以下：测试

每次使用 “hadoop namenode -format”命令格式化文件系统的时候会出现一个新的namenodeId，而我咱们在搭建Hadoop单机伪分布式版本的时候往咱们本身建立的tmp目录下放了数据，如今须要把各台机器上的“/usr/local/hadoop/hadoop-1.2.1/”下面的tmp及其子目录的内容清空，于此同时把“/tmp”目录下的与hadoop相关的内容都清空，最后要把咱们自定义的hdfs文件夹中的data和name文件夹中的内容清空：spa

把Slave1和Slave2中一样的内容均删除掉。orm

从新格式化并从新启动集群，此时进入Master的Web控制台：进程

此时能够看到Live Nodes只有三个，这正是咱们预期的，由于咱们Master、Slave一、Slave2都设置成为了DataNode，固然Master自己同时也是NameNode。hadoop

此时咱们经过JPS命令查看一下三台机器中的进程信息：it

发现Hadoop集群的各类服务都正常启动。

至此，Hadoop集群构建完毕。

【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群（第二步）（4）

4.测试Hadoop分布式集群环境；

【Spark亚太研究院系列丛书】Spark实战高手之路-第一章构建Spark集群（第二步）（4）