Hadoop Local（本地）模式搭建

时间 2020-05-08

原文原文链接

1. 下载压缩包

2. 配置环境变量

3. 配置Hadoop的JAVA_HOME路径

4. WordCount

1. 下载压缩包

下载Hadoop binary二进制压缩包 https://hadoop.apache.org/releases.html

上传到Linux并解压html

2. 配置环境变量

提早先配置好java环境变量，编辑 vi /etc/profilejava

export HADOOP_HOME=/usr/soft/hadoop-2.7.2
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL

运行 source /etc/profile 使配置生效apache

3. 配置Hadoop的JAVA_HOME路径

进入Hadoop解压目录，vi ./etc/hadoop/hadoop-env.sh
设置JAVA_HOME路径oop

export JAVA_HOME=/usr/soft/jdk1.8.0_144

4. WordCount

单机版Hadoop环境已经搭建完成，运行一个统计单词数量的Demo来了解一下Hadoop的运行机制spa

复制一些xml文件

mkdir /usr/soft/input
cp ./hadoop/*.xml /usr/soft/inputcode

执行Hadoop命令

格式: hadoop jar <jar包> <类> <输入文件夹> <输出文件夹> <条件>xml

hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /usr/soft/input /usr/soft/outputhtm

注意，保证以前没有这个output目录,成功以后会产生2个文件blog

[root@localhost output]# ll
total 8
-rw-r--r--. 1 root root 5552 Jan  2 17:20 part-r-00000
-rw-r--r--. 1 root root    0 Jan  2 17:20 _SUCCESS

part-r-00000 结果文件
_SUCCESS 成功标志

查看结果

[root@localhost output]# more part-r-00000 
"*"     17
"AS     6
--More--(1%)

查看hdfs文件列表

hdfs dfs -ls /hadoop