hadoop2.7.3 HA高可用集群安装

时间 2020-07-23

标签 hadoop2.7.3 hadoop 可用集群安装栏目 Hadoop 繁體版

原文原文链接

hadoop2.7.3 HA高可用集群安装html

1. 环境准备node
2. Hadoop安装配置shell
4. 修改配置apache
1. 全部节点安装jdk1.8，ssh，配置hosts文件，配置centos680和centos681之间的互相免登录，centos680到其余全部机器的免登录，关闭防火墙。centos
2. 在centos682，centos683，centos684上安装Zookeeper3.4.9。ssh
4. 复制hadoop-2.7.3.tar.gz到centos680的/opt目录下，之后全部的操做都在centos680上进行。ide
5. 解压hadoop-2.7.3.tar.gz到/opt/bigdata文件夹下：tar –zxvf hadoop-2.7.3.tar.gz –C /opt/bigdata/。oop
1. ResourceManager借助zk实现热备，当某个节点失效以后另外一个节点可以被通知，并接管任务。url
2. NN必须实现共享元数据才能保证无缝切换；共享元数据能够采用Linux提供的NFS服务，也能够使用Hadoop提供的JournalNode；JournalNode采用多数派理论，保证半数以上的节点写成功即认为成功。spa
3. NN要实现自动切换（不须要手工切换），就必须实现实时监控每一个节点的状态；这里采用DFSFailoverController进行监控，若是某个NN失败，其余NN可以经过ZK被通知到，并接替NN的任务。
1. HDFS高可用性（NameNode）
3. RM高可用性（ResourceManager）
5. Hadoop2.7.3 HA搭建步骤
2. hadoop-env.sh
修改JAVA_HOME
2. core-site.xml
2. hdfs-site.xml
[html] view plain copy
1. <property>
2. <name>dfs.nameservices</name>
3. <value>ns</value>
4. </property>
6. <property>
7. <name>dfs.ha.namenodes.ns</name>
8. <value>nn1,nn2</value>
9. </property>
11. <property>
12. <name>dfs.namenode.rpc-address.ns.nn1</name>
13. <value>centos680:9000</value>
14. </property>
16. <property>
17. <name>dfs.namenode.http-address.ns.nn1</name>
18. <value>centos680:50070</value>
19. </property>
21. <property>
22. <name>dfs.namenode.rpc-address.ns.nn2</name>
23. <value>centos681:9000</value>
24. </property>
26. <property>
27. <name>dfs.namenode.http-address.ns.nn2</name>
28. <value>centos681:50070</value>
29. </property>
31. <property>
32. <name>dfs.namenode.shared.edits.dir</name>
33. <value>qjournal://zk1:8485;zk2:8485;zk3:8485/ns</value>
34. </property>
36. <property>
37. <name>dfs.journalnode.edits.dir</name>
38. <value>/opt/big/hadoop-2.7.3/journaldata</value>
39. </property>
41. <property>
42. <name>dfs.ha.automatic-failover.enabled</name>
43. <value>true</value>
44. </property>
46. <property>
47. <name>dfs.client.failover.proxy.provider.ns</name>
48. <value>
49. org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
50. </value>
51. </property>
52. <property>
53. <name>dfs.ha.fencing.methods</name>
54. <value>
55. sshfence
56. shell(/bin/true)
57. </value>
58. </property>
59. <property>
60. <name>dfs.ha.fencing.ssh.private-key-files</name>
61. <value>/root/.ssh/id_rsa</value>
62. </property>
63. <property>
64. <name>dfs.ha.fencing.ssh.connect-timeout</name>
65. <value>30000</value>
66. </property>
2. mapred-side.xml
[html] view plain copy
1. <span style="white-space:pre"> </span><property>
2. <name>mapreduce.framework.name</name>
3. <value>yarn</value>
4. </property>
2. yarn-site.xml
3. [html] view plain copy
4. <configuration>
5. 
7. <property>
9. <name>yarn.resourcemanager.ha.enabled</name>
11. <value>true</value>
13. </property>
15. 
17. <property>
19. <name>yarn.resourcemanager.cluster-id</name>
21. <value>yrc</value>
23. </property>
25. 
27. <property>
29. <name>yarn.resourcemanager.ha.rm-ids</name>
31. <value>rm1,rm2</value>
33. </property>
35. 
37. <property>
39. <name>yarn.resourcemanager.hostname.rm1</name>
41. <value>h0</value>
43. </property>
45. <property>
47. <name>yarn.resourcemanager.hostname.rm2</name>
49. <value>h1</value>
51. </property>
53. 
55. <property>
57. <name>yarn.resourcemanager.zk-address</name>
59. <value>h2:2181,h3:2181,h4:2181</value>
61. </property>
63. <property>
65. <name>yarn.nodemanager.aux-services</name>
67. <value>mapreduce_shuffle</value>
69. </property>
71. </configuration>
2. slaves
2. 分发到其余节点（在centos680上操做）
scp -r /opt/bigdata/hadoop-2.7.3/ h1:/opt/bigdata/
scp -r /opt/bigdata/hadoop-2.7.3/ h2:/opt/bigdata/
scp -r /opt/bigdata/hadoop-2.7.3/ h3:/opt/bigdata/
scp -r /opt/bigdata/hadoop-2.7.3/ h4:/opt/bigdata/
2. 到h2,h3,h4启动全部的Zookeeper。
3. 到h2,h3,h4启动JournalNode（hadoop-daemon.sh start journalnode）
4. 到centos680上执行格式化namenode（hdfs namenode -format）,并将格式化后的元数据内容复制到另一个namenode节点中（h1）:scp -r tmp/ h1:/opt/bigdata/hadoop-2.7.3/(tmp是在core-site中配置的namenode元数据应该所处的位置)
5. 格式化zk：bin/hdfs zkfc –formatZK。该操做在Zookeeper中建立了数据节点：
6. 初始化和启动
2. 启动dfs和yarn
sbin/start-dfs.sh
sbin/start-yarn.sh
2. 验证
经过杀死active的namenode进程或者关闭namenode所在机器来验证切换状况。