Hadoop-2.7.2伪分布式集群搭建

  • 1.1 修改主机名
      vim /etc/sysconfig/networkjava

      NETWORKING=yes
      HOSTNAME=FTH01
       1.2 修改IP
       两种方式:
      第一种:经过Linux图形界面进行修改(强烈推荐)
       进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections -> 选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 -> method选择为manual -> 点击add按钮 -> 添加                IP:192.168.8.118 子网掩码:255.255.255.0 网关:192.168.1.1 -> apply
       第二种:修改配置文件方式(屌丝程序猿专用)
      vim /etc/sysconfig/network-scripts/ifcfg-eth0
      
       DEVICE=”eth0”
       BOOTPROTO=”static”
      HWADDR=”00:0C:29:3C:BF:E7”
      IPV6INIT=”yeED=”yes”
       ONBOOT=”yes”
      TYPE=”Ethernet”
      UUID=”ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c”
       IPADDR=”192.168.8.11”
      NETMASK=”255.255.255.0”
       GATEWAY=”192.168.8.1”
      node

      执行service network restart 命令使设置生效
       1.3 修改主机名和IP的映射关系
      vim /etc/hostslinux

      192.168.8.11 FTH01
      1.4 关闭防火墙
      #查看防火墙状态
       service iptables status
      #关闭防火墙
      service iptables stop
      #查看防火墙开机启动状态
      chkconfig iptables –list
      #关闭防火墙开机启动
      chkconfig iptables off
      1.5 重启Linux
      reboot
      注意!!!!!!
        CentOS的位数要与Hadoop jdk的位数一致web

    1. 安装JDK
         2.1 上传
          经过filezilla软件上传文件,或者经过secureCRT
        2.2 解压jdk
           #建立文件夹
           mkdir /usr/java
           #解压
          tar -zxvf jdk-7u55-linux-i586.tar.gz -C /usr/java/vim

        2.3 将java添加到环境变量中
          vim /etc/profile
          #在文件最后添加
          
           export JAVA_HOME=/usr/java/jdk1.7.0_55
           export PATH=$PATH:$JAVA_HOME/bin
           

          
           bash

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL
export JAVA_HOME=/root/Downloads/jdk1.8.0_92
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_HOME=/root/Downloads/hadoop-2.7.2

     
     #刷新配置
     source /etc/profile网络

  1. 安装hadoop2.7.2app

        解压hadoop安装文件到/fth/下
        tar -zxvf hadoop文件 -C /fth/
        注意:hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop
        伪分布式须要修改5个配置文件 /fth/hadoop-2.7.2/conf/
      3.1 配置hadoop
         第一个:hadoop-env.sh
        vim hadoop-env.sh
        #第27行
        
         export JAVA_HOME=/usr/java/jdk1.8.0_65

        第二个:core-site.xml
        
        <!-- 制定HDFS的老大(NameNode)的地址 -->
        <property>
           <name>fs.defaultFS</name>
          <value>hdfs://FTH01:9000</value>
        </property>
        <!-- 指定hadoop运行时产生文件的存储目录 -->
        <property>
          <name>hadoop.tmp.dir</name>
          <value>/itcast/hadoop-2.7.2/tmp</value>
       </property>

      第三个:hdfs-site.xml
       
        <!-- 指定HDFS副本的数量 -->
        <property>
          <name>dfs.replication</name>
          <value>1</value>
       </property>

      第四个:mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
      mv mapred-site.xml.template mapred-site.xml
      vim mapred-site.xml
       
        <!-- 指定mr运行在yarn上 -->
        <property>
           <name>mapreduce.framework.name</name>
           <value>yarn</value>
       </property>
      

       第五个:yarn-site.xml
      
        <!-- 指定YARN的老大(ResourceManager)的地址 -->
         <property>
          <name>yarn.resourcemanager.hostname</name>
          <value>itcast01</value>
       </property>
        <!-- reducer获取数据的方式 -->
       <property>
          <name>yarn.nodemanager.aux-services</name>
          <value>mapreduce_shuffle</value>
       </property>
      
      

      3.2 将hadoop添加到环境变量
      vim /etc/proflie
      
       export JAVA_HOME=/usr/java/jdk1.8.0_65
      export HADOOP_HOME=/itcast/hadoop-2.7.2
      export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
       source /etc/profile
      

      3.3 格式化namenode(是对namenode进行初始化)
       hdfs namenode -format (hadoop namenode -format)ssh

      3.4 启动hadoop
       先启动HDFS
      sbin/start-dfs.sh分布式

      再启动YARN
      sbin/start-yarn.sh

      3.5 验证是否启动成功
      使用jps命令验证
      27408 NameNode
       28218 Jps
      27643 SecondaryNameNode
       28066 NodeManager
      27803 ResourceManager
      27512 DataNode
      http://192.168.8.118:50070 (HDFS管理界面)
       http://192.168.8.118:8088 (MR管理界面)

  2. 配置ssh免登录   #生成ssh免登录密钥   #进入到个人home目录   cd ~/.ssh   ssh-keygen -t rsa (四个回车)   执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)   将公钥拷贝到要免登录的机器上 cp id_rsa.pub authorized_keys   ssh-copy-id localhost   例如 ssh-copy-id 192.168.8.99 将192.168.8.88的公钥拷给192.168.8.99 之后就能够不用输入密码,直接连上192.168.8.99