1.HADOOP是以JAVA语言写成的,须要预先在本地计算机上安装JDK,因为直接使用wget不能绕过ORACLE的网站验证,可使用下面代码下载。java
wget --no-cookies --no-check-certificate --header "Cookie: gpw_e24=http%3A%2F%2Fwww.oracle.com%2F;oraclelicense=accept-securebackup-cookie" "http://download.oracle.com/otn-pub/java/jdk/8u77-b03/jdk-8u77-linux-x64.rpm"
2.将下载的JDK拷贝到所须要安装的目录下。如:/usr/jdk
node
3.安装JDKlinux
4.配置JAVA_HOME以及CLASS_PATH,vi 进入/etc/profile,在文件最后加上以下语句apache
export JAVA_HOME=/usr/jdk/jdk1.7.0_71 export PATH=$JAVA_HOME/bin:$PATH export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar export JAVA_HOME PATH CLASSPATH
保存退出,执行下面命令使配置生效:ubuntu
source /etc/profile
5.执行下面命令查看当前版本配置是否生效cookie
java -version
在ubuntu linux上使用以下命令安装:
oracle
sudo apt-get install ssh sudo apt-get install rsync
在RedHat/CentOS上使用以下命令安装:ssh
sudo yum install ssh sudo yum install rsync
单机伪分布使用以下命令配置免密码登陆分布式
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
使用ssh localhost 命令测试是否还须要密码才能登陆,若是不须要密码就能够进入,说明配置成功。ide
1.下载Hadoop稳定版并解压
wget http://mirrors.cnnic.cn/apache/hadoop/core/hadoop-1.2.1/hadoop-1.2.1-bin.tar.gz tar -xzvf hadoop-1.2.1/hadoop-1.2.1-bin.tar.gz
2.配置hadoop环境
切换到hadoop安装路径找到hadoop-1.2.1下的conf/hadoop-env.sh文件,使用vi打开。
vi ./hadoop-env.sh <!--在文件中添加下面语句--!> export JAVA_HOME=/usr/java/jdk1.6.0
配置conf/core-site.xml conf/hdfs-site.xml conf/mapred-site.xml
打开conf/core-site.xml文件,编辑以下:
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> </configuration>
打开conf/hdfs-site.xml文件,编辑以下:
<configuration> <property> <name>dfs.name.dir</name> <value>/usr/local/Hadoop/datalog1,/usr/local/hadoop/datalog2</value> </property> <property> <name>dfs.data.dir</name> <value>/usr/local/hadoop/data1,/usr/local/hadoop/data2</value> </property> <property> <name>dfs.replication</name> <value>2</value> </property> </configuration>
打开conf/mapred-site.xml文件,编辑以下:
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration>
建议将HADOOP的bin目录配置到PATH环境变量
PATH="$PATH":你的hadoop的bin目录路径
1.格式化分布式文件系统HDFS
hadoop namenode -front
2.启动hadoop环境
start-all.sh
3.中止hadoop运行
stop-all.sh
4.运行测试程序
hadoop jar $HADOOP_HOME/hadoop-examples-1.2.1.jar \
5.查看集群状态
jps