centos7搭建hadoop2.10彻底分布式

时间 2020-01-30

标签 centos7 centos 搭建 hadoop2.10 hadoop 彻底分布式栏目 Tomcat 繁體版

原文原文链接

本篇介绍在centos7中你们hadoop2.10彻底分布式，首先准备4台机器：1台nn(namenode);3台dn(datanode)html

IP	hostname	进程
192.168.30.141	s141	nn（namenode）
192.168.30.142	s142	dn（datanode）
192.168.30.143	s143	dn（datanode）
192.168.30.144	s144	dn（datanode）

因为本人使用的是vmware虚拟机，因此在配置好一台机器后，使用克隆，克隆出剩余机器，并修改hostname和IP，这样每台机器配置就都统一了每台机器配置添加hdfs用户及用户组，配置jdk环境，安装hadoop 　　见：centos7搭建hadoop2.10伪分布模式node

下面是安装彻底分布式的一些步骤和细节：vim

1.设置每台机器的hostname 和 hostscentos

设置hostname，这里用s+ip最后一组数字(如：192.168.30.141为s141)，修改一下文件ssh

vim /etc/hostname

修改hosts文件，hosts设置有后可使用hostname访问机器，这样比较方便，修改以下：分布式

127.0.0.1 locahost
192.168.30.141 s141
192.168.30.142 s142
192.168.30.143 s143
192.168.30.144 s144

2.配置无密登陆，即ssh无密登陆oop

咱们将s141设置为nn，就须要s141可以经过ssh无密登陆到其余机器，这样就须要在s141机器hdfs用户下生成密钥对，并将s141公钥发送到其余机器放到~/.ssh/authorized_keys文件中centos7

在s141机器上生成密钥对：spa

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

执行命令后3d

说明成功了，查看 ~/.ssh下是否生成密钥对：

将id_rsa.pub文件内容追加到s141-s144机器的/home/centos/.ssh/authorized_keys中，如今其余机器暂时没有authorized_keys文件，咱们就将id_rsa.pub改名为authorized_keys便可，若是其余机器已存在authorized_keys文件能够将id_rsa.pub内容追加到该文件后，远程复制可使用scp命令：

scp id_rsa.pub hdfs@s141:/home/hdfs/.ssh/authorized_keys
scp id_rsa.pub hdfs@s142:/home/hdfs/.ssh/authorized_keys
scp id_rsa.pub hdfs@s143:/home/hdfs/.ssh/authorized_keys
scp id_rsa.pub hdfs@s144:/home/hdfs/.ssh/authorized_keys

s141机器可使用cat生成authorized_keys文件

cat id_rsa.pub >> authorized_keys

此时authorized_keys文件权限须要改成644(注意，常常会由于这个权限问题致使ssh无密登陆失败)

chmod 644 authorized_keys

3.配置hadoop配置文件（${hadoop_home}/etc/hadoop/）

core-sit.xml:

        <?xml version="1.0" encoding="UTF-8"?>
        <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
        <configuration>
                <property>
                        <name>fs.defaultFS</name>
                        <value>hdfs://s141/</value>
                </property>
        </configuration>

hdfs-site.xml:

　　　　 <?xml version="1.0" encoding="UTF-8"?>
        <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
        <configuration>
                <property>
                        <name>dfs.replication</name>
                        <value>3</value>
                </property>
        </configuration>

mapred-site.xml:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
   <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
   </property>
</configuration>

yarn-site.xml:

<?xml version="1.0"?>
<configuration>
<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>s141</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

slaves（指定数据节点）:

s142
s143
s144

hadoop-env.sh（配置jdk环境变量）:

export JAVA_HOME=/opt/soft/jdk

4.将s141中hadoop配置文件分发大其余机器上，使用scp

scp -r hadoop hdfs@s142:/opt/soft/hadoop/etc/
scp -r hadoop hdfs@s143:/opt/soft/hadoop/etc/
scp -r hadoop hdfs@s144:/opt/soft/hadoop/etc/

5.格式化hdfs

首先删除/tmp/下相关hadoop文件，能够直接清空，删除${hadoop_home}/logs 下日志文件

格式化文件系统

hadoop namenode -format

6.启动hadoop

start-all.sh

7.验证启动是否成功

使用jps查看进程

nn:

dn:

页面访问：http://192.168.30.141:50070

说明启动成功