Hadoop-2.7.2伪分布式集群搭建

时间 2020-07-03 标签 hadoop 2.7.2 分布式集群搭建

1.1 修改主机名
　　vim /etc/sysconfig/networkjava

　　NETWORKING=yes
　　HOSTNAME=FTH01
　　 1.2 修改IP
　　两种方式：
　　第一种：经过Linux图形界面进行修改（强烈推荐）
　　进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections -> 选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 -> method选择为manual -> 点击add按钮 -> 添加　　　　　　　　　　　　　　　　IP：192.168.8.118 子网掩码：255.255.255.0 网关：192.168.1.1 -> apply
　　第二种：修改配置文件方式（屌丝程序猿专用）
　　vim /etc/sysconfig/network-scripts/ifcfg-eth0
　　
　　 DEVICE=”eth0”
　　 BOOTPROTO=”static”
　　HWADDR=”00:0C:29:3C:BF:E7”
　　IPV6INIT=”yeED=”yes”
　　 ONBOOT=”yes”
　　TYPE=”Ethernet”
　　UUID=”ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c”
　　 IPADDR=”192.168.8.11”
　　NETMASK=”255.255.255.0”
　　 GATEWAY=”192.168.8.1”
　　node

　　执行service network restart 命令使设置生效
　　 1.3 修改主机名和IP的映射关系
　　vim /etc/hostslinux

　　192.168.8.11 FTH01
　　1.4 关闭防火墙
　　#查看防火墙状态
　　 service iptables status
　　#关闭防火墙
　　service iptables stop
　　#查看防火墙开机启动状态
　　chkconfig iptables –list
　　#关闭防火墙开机启动
　　chkconfig iptables off
　　1.5 重启Linux
　　reboot
　　注意！！！！！！
　　　　CentOS的位数要与Hadoop jdk的位数一致web
1. 安装JDK
  　　 2.1 上传
  　　　　经过filezilla软件上传文件，或者经过secureCRT
  　　2.2 解压jdk
  　　　　#建立文件夹
  　　　　mkdir /usr/java
  　　　　#解压
  　　　　tar -zxvf jdk-7u55-linux-i586.tar.gz -C /usr/java/vim
  
  　　2.3 将java添加到环境变量中
  　　　　vim /etc/profile
  　　　　#在文件最后添加
  　　　　　　　　export JAVA_HOME=/usr/java/jdk1.7.0_55 　　　　export PATH=$PATH:$JAVA_HOME/bin 　　　　
  　　　
  　　　　bash

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL
export JAVA_HOME=/root/Downloads/jdk1.8.0_92
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_HOME=/root/Downloads/hadoop-2.7.2

　　　　
　　　　#刷新配置
　　　　source /etc/profile网络

安装hadoop2.7.2app

　　　　解压hadoop安装文件到/fth/下
　　　　tar -zxvf hadoop文件 -C /fth/
　　　　注意：hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop
　　　　伪分布式须要修改5个配置文件 /fth/hadoop-2.7.2/conf/
　　3.1 配置hadoop
　　　　第一个：hadoop-env.sh
　　　　vim hadoop-env.sh
　　　　#第27行
　　　　　　　　 export JAVA_HOME=/usr/java/jdk1.8.0_65
　　　　第二个：core-site.xml
　　　　　　　　 　　　　<property> 　　　　　　 <name>fs.defaultFS</name> 　　　　　　<value>hdfs://FTH01:9000</value> 　　　　</property> 　　　　 　　　　<property> 　　　　　　<name>hadoop.tmp.dir</name> 　　　　　　<value>/itcast/hadoop-2.7.2/tmp</value> 　　 </property>
　　第三个：hdfs-site.xml
　　　　　　　 　　　　<property> 　　　　　　<name>dfs.replication</name> 　　　　　　<value>1</value> 　　 </property>
　　第四个：mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
　　mv mapred-site.xml.template mapred-site.xml
　　vim mapred-site.xml
　　　　　　　 　　　　<property> 　　　　　　 <name>mapreduce.framework.name</name> 　　　　　　 <value>yarn</value> 　　 </property> 　　
　　　第五个：yarn-site.xml
　　　　　　 　　　　<property> 　　　　　　<name>yarn.resourcemanager.hostname</name> 　　　　　　<value>itcast01</value> 　　 </property> 　　　　 　　 <property> 　　　　　　<name>yarn.nodemanager.aux-services</name> 　　　　　　<value>mapreduce_shuffle</value> 　　 </property> 　　　　
　　3.2 将hadoop添加到环境变量
　　vim /etc/proflie
　　　　 export JAVA_HOME=/usr/java/jdk1.8.0_65 　　export HADOOP_HOME=/itcast/hadoop-2.7.2 　　export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin 　　 source /etc/profile 　　
　　3.3 格式化namenode（是对namenode进行初始化）
　　 hdfs namenode -format (hadoop namenode -format)ssh

　　3.4 启动hadoop
　　先启动HDFS
　　sbin/start-dfs.sh分布式

　　再启动YARN
　　sbin/start-yarn.sh

　 3.5 验证是否启动成功
　　使用jps命令验证
　　27408 NameNode
　　 28218 Jps
　　27643 SecondaryNameNode
　　 28066 NodeManager
　　27803 ResourceManager
　　27512 DataNode
　　http://192.168.8.118:50070 （HDFS管理界面）
　　 http://192.168.8.118:8088 （MR管理界面）
配置ssh免登录　　#生成ssh免登录密钥　　#进入到个人home目录　　cd ~/.ssh 　　ssh-keygen -t rsa （四个回车）　　执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）　　将公钥拷贝到要免登录的机器上 cp id_rsa.pub authorized_keys 　　ssh-copy-id localhost 　　例如 ssh-copy-id 192.168.8.99 将192.168.8.88的公钥拷给192.168.8.99 之后就能够不用输入密码，直接连上192.168.8.99