下载地址http://hadoop.apache.org/apache
2.安装tar -zxvf hadoop-2.6.0-cdh5.12.2.tar.gzide
3.建立文件夹储存hadoop,给hadoop重命名oop
4.进入etc文件夹选择hadoop文件夹 cd hadoopspa
5.开始配置hadoop-env.sh 修改其中的JAVA_HOME路径3d
fs.defaultFS默认文件系统的名称,用来肯定主机、端口等对于一个文件系统.xml
hadoop.tmp.dir是hadoop的临时文件目录blog
hadoop.proxyuser.root.users 远程使用root登陆的用户
hadoop.proxyuser.root.groups远程root组的用户登陆
dfs.replication文件副本数量,副本数量默认按128M进行切分,若小于此值的话则不切分!一个文件,上传到hdfs上时指定的是几个副本就是几个。之后你修改了副本数,对已经上传了的文件也不会起做用。
8.复制mapred-site.xml.template 并修改内容
yarn.resourcemanager.address提供客户端访问的地址。客户端经过该地址向RM提交应用程序,杀死应用程序等
yarn.nodemanager.aux-services经过该配置项,用户能够自定义一些服务,例如Map-Reduce的shuffle功能就是采用这种方式实现的,这样就能够在NodeManager上扩展本身的服务。
Shuffle把一组有必定规则的数据尽可能转换成一组无规则的数据,越随机越好,从Map输出到Reduce输入的整个过程能够广义地称为Shuffle。
export HADOOP_HOME=/opt/bigdata/hadoop260
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_INSTALL=$HADOOP_HOME