启动 Hadoop,仅仅是启动了 MapReduce 环境,咱们能够启动 YARN ,让 YARN 来负责资源管理与任务调度。node
首先修改配置文件 mapred-site.xml,须要先进行重命名:服务器
cd /usr/local/hadoop
mv ./etc/hadoop/mapred-site.xml.template ./etc/hadoop/mapred-site.xml
而后再进行编辑( gedit ./etc/hadoop/mapred-site.xml
):oop
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
接着修改配置文件 yarn-site.xml:spa
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
而后就能够启动 YARN 了(须要先执行过 ./sbin/start-dfs.sh
):code
./sbin/start-yarn.sh # 启动YARN
./sbin/mr-jobhistory-daemon.sh start historyserver # 开启历史服务器,才能在Web中查看任务运行状况
开启后经过 jps
查看,能够看到多了 NodeManager 和 ResourceManager 两个后台进程server
启动 YARN 以后,运行实例的方法仍是同样的,仅仅是资源管理方式、任务调度不一样。但 YARN 主要是为集群提供更好的资源管理与任务调度,然而这在单机上体现不出价值,反而会使程序跑得稍慢些.xml
不启动 YARN 需重命名 mapred-site.xml:若是不想启动 YARN,务必把配置文件 mapred-site.xml 重命名,改为 mapred-site.xml.template,须要用时改回来就行。blog
关闭 YARN :进程
./sbin/stop-yarn.sh
./sbin/mr-jobhistory-daemon.sh stop historyserver