啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式

    伪分布式模式等同于彻底分布式,只是她只有一个节点。node

一) HDFS上运行MapReduce 程序

(1)配置集群web

  (a)配置:hadoop-env.sh浏览器

    Linux系统中获取jdk的安装路径:分布式

    修改JAVA_HOME 路径:oop

  (b)配置:core-site.xml测试

    原始该文件内容spa

    配置后该文件内容命令行

  (c)配置:hdfs-site.xml日志

    该文件原始内容xml

    配置后该文件内容

(2)启动集群

  (a)格式化namenode(第一次启动时格式化,之后就不要总格式化)

  (b)启动namenode

  (c)启动datanode

(3)查看集群

  (a)查看是否启动成功

  (b)查看产生的log日志

  (c)web端查看HDFS文件系统

    在浏览器中输入 http://192.168.47.101:50070/

    至此一个Hadoop的伪分布模式即搭建完成

(4)操做集群

  (a)在hdfs文件系统上建立一个input文件夹

    进入Web查看是否建立成功

  (b)将测试文件内容上传到文件系统上

  (c)查看上传的文件是否正确

  (d)在Hdfs上运行mapreduce程序

  (e)查看输出结果

    命令行查看:

    浏览器查看

  (f)将测试文件内容下载到本地

    点击上一步浏览器查看中的part-r-00000

    将 part-r-00000文件下载后查看

  (g)删除输出结果

二) YARN上运行MapReduce 程序

(1)配置集群

  (a)配置yarn-env.sh

    配置JAVA_HOME

  (b)配置yarn-site.xml

    增长两个属性节点

  (c)配置:mapred-env.sh

            配置JAVA_HOME

  (d)配置: (对mapred-site.xml.template从新命名为) mapred-site.xml

            并配置相应节点

(2)启动集群

        启动集群以前先要保证namenode和datanode正常启动

  (a)启动resourcemanager

  (b)启动nodemanager

(3)集群操做

  (a)yarn的浏览器页面查看

            启动成功后在浏览器中输入对应地址可查看

  (b)执行mapreduce程序

  (c)查看运行结果

  (d)删除文件系统上的output文件

三) 修改本地临时文件存储目录

1)中止进程

        按照resourcemanager/nodemanager->datanode/namenode的前后顺中止进程

2)修改hadoop.tmp.dir

        hadoop默认生成的dfs等文件放在 /tmp/hadoop-{hostname} 下的当重启后 系统临时文件夹中内容被清除,所以须要从新配置临时文件夹

在hadoop-2.7.2中新建 data/tmp 文件夹

后修改 core-site.xml,增长属性节点

3)格式化NameNode

4)启动全部进程

        按照 namenode/datanode->resourcemanager/nodemanager顺序启动

5)查看/opt/module/hadoop-2.7.2/data/tmp这个目录下的内容

相关文章
相关标签/搜索