啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式

时间 2019-12-13

标签啃掉 hadoop 系列笔记运行模式分布式栏目 Hadoop 繁體版

原文原文链接

伪分布式模式等同于彻底分布式，只是她只有一个节点。node

一） HDFS上运行MapReduce 程序

（1）配置集群web

　　（a）配置：hadoop-env.sh浏览器

　　　　Linux系统中获取jdk的安装路径：分布式

　　　　修改JAVA_HOME 路径：oop

　　（b）配置：core-site.xml测试

　　　　原始该文件内容spa

　　　　配置后该文件内容命令行

　　（c）配置：hdfs-site.xml日志

　　　　该文件原始内容xml

　　　　配置后该文件内容

（2）启动集群

　　（a）格式化namenode（第一次启动时格式化，之后就不要总格式化）

　　（b）启动namenode

　　（c）启动datanode

（3）查看集群

　　（a）查看是否启动成功

　　（b）查看产生的log日志

　　（c）web端查看HDFS文件系统

　　　　在浏览器中输入 http://192.168.47.101:50070/

　　　　至此一个Hadoop的伪分布模式即搭建完成

（4）操做集群

　　（a）在hdfs文件系统上建立一个input文件夹

　　　　进入Web查看是否建立成功

　　（b）将测试文件内容上传到文件系统上

　　（c）查看上传的文件是否正确

　　（d）在Hdfs上运行mapreduce程序

　　（e）查看输出结果

　　　　命令行查看：

　　　　浏览器查看

　　（f）将测试文件内容下载到本地

　　　　点击上一步浏览器查看中的part-r-00000

　　　　将 part-r-00000文件下载后查看

　　（g）删除输出结果

二） YARN上运行MapReduce 程序

（1）配置集群

　　（a）配置yarn-env.sh

　　　　配置JAVA_HOME

　　（b）配置yarn-site.xml

　　　　增长两个属性节点

　　（c）配置：mapred-env.sh

配置JAVA_HOME

　　（d）配置： (对mapred-site.xml.template从新命名为) mapred-site.xml

并配置相应节点

（2）启动集群

启动集群以前先要保证namenode和datanode正常启动

　　（a）启动resourcemanager

　　（b）启动nodemanager

（3）集群操做

　　（a）yarn的浏览器页面查看

启动成功后在浏览器中输入对应地址可查看

　　（b）执行mapreduce程序

　　（c）查看运行结果

　　（d）删除文件系统上的output文件

三）修改本地临时文件存储目录

1）中止进程

按照resourcemanager/nodemanager->datanode/namenode的前后顺中止进程

2）修改hadoop.tmp.dir

hadoop默认生成的dfs等文件放在 /tmp/hadoop-{hostname} 下的当重启后系统临时文件夹中内容被清除，所以须要从新配置临时文件夹

在hadoop-2.7.2中新建 data/tmp 文件夹

后修改 core-site.xml，增长属性节点

3）格式化NameNode

4）启动全部进程

按照 namenode/datanode->resourcemanager/nodemanager顺序启动

5）查看/opt/module/hadoop-2.7.2/data/tmp这个目录下的内容

啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式

一） HDFS上运行MapReduce 程序

二） YARN上运行MapReduce 程序

三） 修改本地临时文件存储目录

三）修改本地临时文件存储目录