一、在windows下配置hadoop的环境变量
二、拷贝debug工具(winutils.ext)到HADOOP_HOME/bin
三、修改hadoop的源码 放到src目录下node
四、MR调用的代码须要改变:
a、src不能有服务器的hadoop配置文件
b、在调用是使用:
Configuration config = new Configuration();
config.set("fs.defaultFS", "hdfs://node11:8020");
config.set("yarn.resourcemanager.hostname", "node11");apache
首先须要在src下放置服务器上的hadoop配置文件windows
一、在本地直接调用,执行过程在服务器上(真正企业运行环境)
a、把MR程序打包(jar),直接放到本地
b、修改hadoop的源码
c、增长一个属性:
config.set("mapred.jar", "C:\\Users\\Administrator\\Desktop\\wc.jar");
d、本地执行main方法调用MR。服务器
若是出现下面这个错误工具
org.apache.hadoop.security.AccessControlException: Permission denied: user=xxx, access=WRITE, inode="xxx":root:supergroup:rwxr-xr-xoop
在hadoop集群上执行命令 ./hadoop fs -chmod 777 /tmp/hadoop-yarn/staging/xxx 给对应的用户加权限
二、直接在服务器上,使用命令的方式调用,执行过程也在服务器上
a、把MR程序打包(jar),传送到服务器上
b、经过: hadoop jar jar路径 类的全限定名测试
命令 bin/hadoop dfsadmin -safemode leavespa