/usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop启动时的配置信息。html
编辑器中打开此文件node
sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xmlapache
在该文件的<configuration></configuration>之间增长以下内容:浏览器
<property>框架
<name>fs.default.name</name>编辑器
<value>hdfs://localhost:9000</value>oop
</property>spa
保存、关闭编辑窗口。3d
最终修改后的文件内容以下:orm
/usr/local/hadoop/etc/hadoop/yarn-site.xml包含了MapReduce启动时的配置信息。
编辑器中打开此文件
sudo gedit yarn-site.xml
在该文件的<configuration></configuration>之间增长以下内容:
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容以下
默认状况下,/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件,咱们要复制该文件,并命名为mapred.xml,该文件用于指定MapReduce使用的框架。
复制并重命名
cp mapred-site.xml.template mapred-site.xml
编辑器打开此新建文件
sudo gedit mapred-site.xml
在该文件的<configuration></configuration>之间增长以下内容:
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容以下
/usr/local/hadoop/etc/hadoop/hdfs-site.xml用来配置集群中每台主机均可用,指定主机上做为namenode和datanode的目录。
建立文件夹,以下图所示
你也能够在别的路径下建立上图的文件夹,名称也能够与上图不一样,可是须要和hdfs-site.xml中的配置一致。
编辑器打开hdfs-site.xml
在该文件的<configuration></configuration>之间增长以下内容:
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/hdfs/data</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容以下:
hdfs namenode -format
只须要执行一次便可,若是在hadoop已经使用后再次执行,会清除掉hdfs上的全部数据。
通过上文所描述配置和操做后,下面就能够启动这个单节点的集群
执行启动命令:
sbin/start-dfs.sh
执行该命令时,若是有yes /no提示,输入yes,回车便可。
接下来,执行:
sbin/start-yarn.sh
执行完这两个命令后,Hadoop会启动并运行
执行 jps命令,会看到Hadoop相关的进程,以下图:
浏览器打开 http://localhost:50070/,会看到hdfs管理页面
浏览器打开http://localhost:8088,会看到hadoop进程管理页面
dfs上建立input目录
bin/hadoop fs -mkdir -p input
把hadoop目录下的README.txt拷贝到dfs新建的input里
hadoop fs -copyFromLocal README.txt input
运行WordCount
hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output
能够看到执行过程
运行完毕后,查看单词统计结果
hadoop fs -cat output/*