namenode负责管理整个hdfs集群,若是namenode故障则集群将不可用.所以有必须实现namenode高可用.
hdfs的高可用原理参考:
HADOOP(二):hdfs 高可用原理
zookeeper简介:
zookeeper集群安装node
下载zookeeper并解压到/optweb
[zookeeper@hadoop1 opt]$ wget http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.9/zookeeper-3.4.9.tar.gz [zookeeper@hadoop1 opt]$ gunzip zookeeper-3.4.9.tar.gz [zookeeper@hadoop1 opt]$ tar -xvf zookeeper-3.4.9.tar.gz
[zookeeper@hadoop1 zookeeper-3.4.9]$ cd conf/ [zookeeper@hadoop1 conf]$ ls configuration.xsl log4j.properties zoo_sample.cfg [zookeeper@hadoop1 conf]$ cp zoo_sample.cfg zoo.cfg [zookeeper@hadoop1 conf]$ vi zoo.cfg tickTime=2000 dataDir=/opt/zookeeper-3.4.9/dataDir dataLogDir=/opt/zookeeper-3.4.9/dataLogDir clientPort=2181 initLimit=5 syncLimit=2 server.1=hadoop3:2888:3888 server.2=hadoop4:2888:3888 server.3=hadoop5:2888:3888
在每一个节点上写上节点的id,如节点1就写1.放在dataDir指定的目录下.docker
bin/zkServer.sh start
若是报错检查zookeeper.outshell
使用客户端链接到zookeeper:apache
[zookeeper@hadoop5 zookeeper-3.4.9]$ bin/zkCli.sh -server 127.0.0.1:2181
连进去表示zookeeper正常bootstrap
HDFS HA中用,nameserivce ID来标识一个HDFS服务,为了标识每一个NN,还要加上namenode id。
在hdfs-site.xml中:
1.设置集群的标识dfs.nameservice安全
<property> <name>dfs.nameservices</name> <value>mycluster</value> </property>
这里修改成dockerclusterdom
2.设置namenode名称 dfs.ha.namenodes.[nameservice ID]ssh
<property> <name>dfs.ha.namenodes.mycluster</name> <value>nn1,nn2</value> </property>
nn1 nn2为namenode的标识。
注意:当前只支持两个namenode的HAide
3.设置namenode对外提供服务的RPC地址 dfs.namenode.rpc-address.[nameservice ID].[name node ID]
<property> <name>dfs.namenode.rpc-address.mycluster.nn1</name> <value>hadoop1:8020</value> </property> <property> <name>dfs.namenode.rpc-address.mycluster.nn2</name> <value>hadoop2:8020</value> </property>
这个RPC地址实际就是 dfs.defaultFS地址
4.设置HDFS web页面地址 dfs.namenode.http-address.[nameservice ID].[name node ID]
<property> <name>dfs.namenode.http-address.mycluster.nn1</name> <value>hadoop1:50070</value> </property> <property> <name>dfs.namenode.http-address.mycluster.nn2</name> <value>hadoop2:50070</value> </property>
若是启用的hdfs的安全机制,要设置 https-address
5.设置journal上edit log共享目录 dfs.namenode.shared.edits.dir
格式是:qjournal://host1:port1;host2:port2;host3:port3/journalId 全部节点上路径要保持一致
<property> <name>dfs.namenode.shared.edits.dir</name> <value>qjournal://hadoop3:8485;hadoop4:8485;hadoop5:8485/mycluster</value> </property>
这里咱们改为: qjournal://hadoop4:8485;hadoop5:8485;hadoop6:8485/dockercluster
6.设置实现集群HA的类 dfs.client.failover.proxy.provider.[nameservice ID]
<property> <name>dfs.client.failover.proxy.provider.mycluster</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> </property>
当前仅支持这个类
7.设置切换时执行的程序 dfs.ha.fencing.methods
当namenode发生切换时,原来active的NN可能依然在写edit log,这时若是standby 也开始写edit log,元数据会"脑裂"。为了防止"脑裂",必需要切换以前杀掉原来active 的NN,这个脚本就是实现这个目的。当前支持两中fencing.method:shell 和 sshfence。另外,可能自定义org.apache.hadoop.ha.NodeFence来实现本身的保护程序。
7.1.sshfence(默认)
经过SSH登陆到原来active的NN,并使用fuser命令KILL掉NN进程。要使用SSH,必须配置rsa-key参数:dfs.ha.fencing.ssh.private-key-files
<property> <name>dfs.ha.fencing.methods</name> <value>sshfence</value> </property> <property> <name>dfs.ha.fencing.ssh.private-key-files</name> <value>/home/hdfs/.ssh/id_rsa</value> </property>
也能够用其它用户登陆,一样能够配置超时参数:
<property> <name>dfs.ha.fencing.methods</name> <value>sshfence([[username][:port]])</value> </property> <property> <name>dfs.ha.fencing.ssh.connect-timeout</name> <value>30000</value> </property>
7.2.shell
自定义一个shell脚本业杀死NAMENODE
<property> <name>dfs.ha.fencing.methods</name> <value>shell(/path/to/my/script.sh arg1 arg2 …)</value> </property>
shell脚本能够读取到当前已经配置的HDFS变量,将"."替换为"_" 便可。对于某些共用的条目,如dfs_namenode_rpc-address能够自动的指向特定节点如dfs.namenode.rpc-address.ns1.nn1。如下变量也能够使用:
$target_host |
$target_port |
$target_address |
$target_namenodeid |
示例:
<property> <name>dfs.ha.fencing.methods</name> <value>shell(/path/to/my/script.sh --nameservice=$target_nameserviceid $target_host:$target_port)</value> </property>
若是shell返回0,表示执行成功。若是不为0,则继续执行其它的fencing.method.shell方式没有timeout.
这时里,咱们也用ssh方式,比较简单,只须要生成key就好了.在NN1 NN2上执行:
[hdfs@hadoop1 ~]$ ssh-keygen -t rsa Generating public/private rsa key pair. Enter file in which to save the key (/home/hdfs/.ssh/id_rsa): Enter passphrase (empty for no passphrase): Enter same passphrase again: Your identification has been saved in /home/hdfs/.ssh/id_rsa. Your public key has been saved in /home/hdfs/.ssh/id_rsa.pub. The key fingerprint is: 6b:de:13:b7:55:ba:43:1c:28:ef:2e:b8:b7:0a:e0:15 hdfs@hadoop1 The key's randomart image is: +--[ RSA 2048]----+ | | | | | E . |
8.journal节点守护进程本身的数据目录 dfs.journalnode.edits.dir
<property> <name>dfs.journalnode.edits.dir</name> <value>/opt/hadoop-2.8.0/journalEditDir</value> </property>
9.在core-site.xml中设置hdfs 服务 fs.defaultFS
一旦使用了HDFS HA,那么fs.defaultFS就不能写成host:port文件,而要写成服务方式,写上nameservice id:
<property> <name>fs.defaultFS</name> <value>hdfs://mycluster</value> </property>
这里改为hdfs://dockercluster
通过以上的配置,能够经过命令手动切换nemenode
1.修改hdfs-site.xml
添加:
<property> <name>dfs.ha.automatic-failover.enabled</name> <value>true</value> </property>
2.修改core-site.xml
添加zookeer的server列表:
<property> <name>ha.zookeeper.quorum</name> <value>hadoop3:2181,hadoop4:2181,hadoop5:2181</value> </property>
1.在zookeeper中初始化HA状态
在其中一台namenode上执行:
[hdfs]$ $HADOOP_PREFIX/bin/hdfs zkfc -formatZK
2.启动HDFS集群
1.启动全部journal节点`$HADOOP_HOME/sbin/hadoop-daemon.sh start journalnode` 2.执行journal 节点初始化`hdfs namenode -initializeSharedEdits` 3.启动原来的namenode `$HADOOP_HOME/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script hdfs start namenode` 4.初始化standby,在standby上执行 `hdfs namenode -bootstrapStandby`, 5.启动standby `$HADOOP_HOME/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script hdfs start namenode` 6.启动namenode自动HA进程zkfc,在每台namenode上执行:$HADOOP_PREFIX/sbin/hadoop-daemon.sh --script $HADOOP_PREFIX/bin/hdfs start zkfc
3.检查HA状况
能够看到两台机器一个是active一个是standby
4.验证自动HA
如今在hadoop1 kill active的namenode
发现hadoop2成了active,说明自动HA配置成功.