Centos7 搭建 hadoop3.1.1 集群教程

时间 2019-11-21

标签 centos7 centos 搭建 hadoop3.1.1 hadoop 集群教程栏目 Tomcat 繁體版

原文原文链接

配置环境要求：

Centos7
jdk 8
Vmware 14 pro
hadoop 3.1.1

Hadoop下载

安装4台虚拟机，如图所示

克隆以后须要更改网卡选项，ip，mac地址，uuidjava
重启网卡:
为了方便使用，操做时使用的root帐户node

设置机器名称

再使用hostname命令，观察是否更改apache

相似的，更改其余三台机器hdp-0二、hdp-0三、hdp-04。vim

在任意一台机器Centos7上修改域名映射
1. vi /etc/hosts
2. 修改以下
3. 使用scp命令发送其余克隆机上 scp /etc/hosts 192.168.126.124:/etc/浏览器
给四台机器生成密钥文件

确认生成。
把每一台机器的密钥都发送到hdp-01上（包括本身）
将全部密钥都复制到每一台机器上

在每一台机器上测试

无需密码则成功，保证四台机器之间能够免密登陆

安装Hadoop

在usr目录下建立Hadoop目录，以保证Hadoop生态圈在该目录下。
使用xsell+xFTP传输文
解压缩Hadoopoop

配置java与hadoop环境变量

1 export JAVA_HOME=/usr/jdk/jdk1.8.0_131
2 export JRE_HOME=${JAVA_HOME}/jre
3 export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
4 export PATH=${JAVA_HOME}/bin:$PATH
5 
6 export HADOOP_HOME=/usr/hadoop/hadoop-3.1.1/
7 export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

注意：以上四台机器都须要配置环境变量测试

修改etc/hadoop中的配置文件

注：除了个别提示，其他文件只用修改hdp-01中的便可ui

修改core-site.xml

 1 <configuration>
 2 <property>
 3 <name>fs.defaultFS</name>
   <!-- 注意别的slave机须要识别master主机名，不然将不能与主机hdp-01沟通 -->

 4 <value>hdfs://hdp-01:9000</value>
 5 </property>
 6  <property>
 7   <name>hadoop.tmp.dir</name>
 8     <!-- 如下为存放临时文件的路径 -->
 9   <value>/opt/hadoop/hadoop-3.1.1/data/tmp</value>
10  </property>
11 </configuration>

修改hadoop-env.shspa
```
1 export JAVA_HOME=/usr/jdk/jdk1.8.0_131
```
注：该步骤须要四台都配置3d

修改hdfs-site.xml

 1 <configuration>
 2 <property>
 3   <name>dfs.namenode.http-address</name>
 4  <!-- hserver1 修改成你的机器名或者ip -->
 5   <value>hdp-01:50070</value>
 6  </property>
 7  <property>
 8   <name>dfs.namenode.name.dir</name>
 9   <value>/hadoop/name</value>
10  </property>
11  <property>
12   <name>dfs.replication</name>
13    <!-- 备份次数 -->
14   <value>1</value>
15  </property>
16  <property>
17   <name>dfs.datanode.data.dir</name>
18   <value>/hadoop/data</value>
19  </property>
20 
21 
22 </configuration>

修改mapred-site.xml

1 <configuration>
2 <property>
3 <name>mapreduce.framework.name</name>
4 <value>yarn</value>
5 </property>
6 </configuration>

修改 workers
```
1 hdp-01
2 hdp-02
3 hdp-03
4 hdp-04
```

修改yarn-site.xml文件

 1 <configuration>
 2 
 3 <!-- Site specific YARN configuration properties -->
 4 <property>
 5 <name>yarn.resourcemanager.hostname</name>
 6  <value>hdp-01</value>
 7 </property>
 8 <property>
 9  <name>yarn.nodemanager.aux-services</name>
10   <value>mapreduce_shuffle</value>
11 </property>
12  <property>
13   <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
14 <value>org.apache.hadoop.mapred.ShuffleHandler</value>
15 </property>
16 <property>
17  <name>yarn.nodemanager.resource.cpu-vcores</name>
18  <value>1</value>
19 </property>
20 
21 </configuration>

注：能够把整个/usr/hadoop目录全部文件复制到其他三个机器上仍是经过scp 嫌麻烦的能够先整一台机器，而后再克隆

启动Hadoop

在namenode上初始化

由于hdp-01是namenode，hdp-0二、hdp=03和hdp-04都是datanode，因此只须要对hdp-01进行初始化操做，也就是对hdfs进行格式化。

执行初始化脚本，也就是执行命令：hdfs namenode -format

等待一会后，不报错返回 “Exiting with status 0” 为成功，“Exiting with status 1”为失败

在namenode上执行启动命令

直接执行start-all.sh 观察是否报错，如报错执行一下内容

$ vim sbin/start-dfs.sh
$ vim sbin/stop-dfs.sh

在空白位置加入

1 HDFS_DATANODE_USER=root
2 
3 HADOOP_SECURE_DN_USER=hdfs
4 
5 HDFS_NAMENODE_USER=root
6 
7 HDFS_SECONDARYNAMENODE_USER=root

$ vim sbin/start-yarn.sh
$ vim sbin/stop-yarn.sh

在空白位置加入

1 YARN_RESOURCEMANAGER_USER=root
2 
3 HADOOP_SECURE_DN_USER=yarn
4 
5 YARN_NODEMANAGER_USER=root

$ vim start-all.sh

$ vim stop-all.sh

1 TANODE_USER=root
2 HDFS_DATANODE_SECURE_USER=hdfs
3 HDFS_NAMENODE_USER=root
4 HDFS_SECONDARYNAMENODE_USER=root
5 YARN_RESOURCEMANAGER_USER=root
6 HADOOP_SECURE_DN_USER=yarn
7 YARN_NODEMANAGER_USER=root

配置完毕后执行start-all.sh

运行jps

显示6个进程说明配置成功

去浏览器检测一下 http://hdp-01:50070

建立目录上传不成功须要受权

hdfs dfs -chmod -R a+wr hdfs://hdp-01:9000/

```
//查看容量
hadoop fs -df -h /
```
查看各个机器状态报告
```
hadoop dfsadmin -report
```

1. Centos7 搭建 hadoop3.1.1 集群教程
2. Centos7上搭建Hadoop3.1.1集群
3. hadoop集群搭建-hadoop3.1.1
4. Centos7虚拟机搭建 Hadoop3.1.1 教程
5. hadoop3.1.1+scala2.12.8+spark2.4.0分布式集群搭建
6. HA高可用hadoop3.1.1集群搭建
7. Centos7集群搭建
8. Hadoop集群搭建教程
9. Redis集群搭建教程
10. RocketMq单机和集群搭建教程
更多相关文章...
• Swarm 集群管理 - Docker教程
• Rust 环境搭建 - RUST 教程
• Github 简明教程
• Java 8 Stream 教程

Centos7 搭建 hadoop3.1.1 集群教程

配置环境要求：

Hadoop下载

安装4台虚拟机，如图所示

设置机器名称

在任意一台机器Centos7上修改域名映射

给四台机器生成密钥文件

在每一台机器上测试

安装Hadoop

配置java与hadoop环境变量

修改etc/hadoop中的配置文件

启动Hadoop