下载Hadoop binary二进制压缩包 https://hadoop.apache.org/releases.html
上传到Linux并解压html
提早先配置好java环境变量,编辑 vi /etc/profile
java
export HADOOP_HOME=/usr/soft/hadoop-2.7.2 PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL
运行 source /etc/profile
使配置生效apache
进入Hadoop解压目录,vi ./etc/hadoop/hadoop-env.sh
设置JAVA_HOME路径oop
export JAVA_HOME=/usr/soft/jdk1.8.0_144
单机版Hadoop环境已经搭建完成,运行一个统计单词数量的Demo来了解一下Hadoop的运行机制spa
mkdir /usr/soft/input
cp ./hadoop/*.xml /usr/soft/input
code
格式: hadoop jar <jar包> <类> <输入文件夹> <输出文件夹> <条件>xml
hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /usr/soft/input /usr/soft/output
htm
注意,保证以前没有这个output目录,成功以后会产生2个文件blog
[root@localhost output]# ll total 8 -rw-r--r--. 1 root root 5552 Jan 2 17:20 part-r-00000 -rw-r--r--. 1 root root 0 Jan 2 17:20 _SUCCESS
[root@localhost output]# more part-r-00000 "*" 17 "AS 6 --More--(1%)
hdfs dfs -ls /
hadoop