网络上关于如何单机模式安装Hadoop的文章不少,按照其步骤走下来多数都失败,按照其操做弯路走过了很多但终究仍是把问题都解决了,因此顺便本身详细记录下完整的安装过程。html
此篇主要介绍在Ubuntu安装完毕后,如何进行Hadoop的安装和配置。java
我所记录的笔记适合没有Linux基础的朋友跟我一块儿操做,同时欢迎高手参观指导。apache
环境约定ubuntu
如下环境基于攥写时间:5th July 2015。vim
宿主机器:Windows 8windows
虚拟机环境:WMware Wrokstation 11bash
Ubuntu版本:Ubuntu Desktop 14.04.2网络
物理环境:ssh
笔记本Thinkpad T420 i5 CPU 4+4=8G内存, 500G硬盘。jvm
其它:
JavaJDK版本:7
Hadoop版本:2.7.0
首先,登陆Ubuntu,进入到命令模式,能够经过两个方法,就是点击左上角的Search按钮,输入Ter而后在下面的结果界面就能够找到控制台Terminal。
另一个方法就是经过快捷键Ctrl+Alt+T。
首先打开虚拟机的网络链接。Ubuntu的配置过程当中包括更新和软件的安装都要以来于互联网环境。
回到控制台,输入以下命令开始更新系统(需联网)。sudo是常常会用到的,提示系统以最高权限运行,有些相似windows下的UAC。
sudo apt-get update
系统会提示输入密码,而后开始下载和安装更新。
完成更新后,接下来在系统中首先建立名称为hadoop的用户名和组。
首先建立组:
sudo addgroup Hadoop
而后再建立用户。
sudo adduser -ingroup hadoop Hadoop
输入这个命令后系统会提示输入密码,而后关于Full Name等信息一路回车就能够。
最后输入以下命令,使新创建的hadoop帐户拥有最高的权限。
sudo gedit /etc/sudoers
系统会弹出Ubuntu Desktop的Gedit工具,这是一个可视化的文本编辑工具,跟windows下的记事本同样。在Ubuntu Server下没有图形化界面,能够经过vim完成相似的编辑和配置工做。
在打开的配置文件中,在root下面加入下面一行。
hadoop ALL=(ALL:ALL) ALL
须要留意的是,若是手动敲入这行内容,hadoop后面跟的是/t,也就是键盘的Tab。若是这里输入不对的话会致使Ubuntu系统出现很大的问题。
编辑完成后点击Gedit上面的Save按钮而后关闭这个工具(Ubuntu Desktop下关闭和最大化等按钮是在每一个窗体的左上方),回到控制台。
接下来配置ssh服务,使系统能够远程登陆。
输入以下命令安装ssh。
sudo apt-get install openssh-server
而后经过以下命令开启ssh服务。
sudo /etc/init.d/ssh start
最后经过以下命令,查看ssh服务是否启动。
ps -e | grep ss
如图看到sshd的话说明ssh启动成功。
接下来配置ssh的免密码登陆,确保其它节点能够不须要密码就能够登陆到系统。(目前不太肯定单击模式中这一步是否必要,但为了后续搭建多节点环境因此先跟着配置。)
首先输入以下命令生成公匙和私匙。
ssh-keygen -t rsa -P ""
而后经过以下命令把公匙的内容加入到authorized_keys中。
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
至此ssh的配置完成。
接下来安装java的jdk,输入以下命令开始安装。安装过程会略微长一些。
sudo apt-get install openjdk-7-jdk
安装完毕后,能够经过以下命令肯定Java的版本。
java –version
接下来下载Hadoop。
打开Ubuntu Desktop的Firefox,输入如下网址:
找到页面的Get started,点击Download。
在下载页中,找到2.7.0版本的二进制下载连接。
而后系统会导航到另一个下载页面,从众多地址中选择一个就能够了。
点击一个连接以后开始下载。
点击Save File以后,下载文件会默认存放在本地Ubuntu的Home/Wade/Downloads下,请留意Wade是我创建的用户名。
回到控制台,敲入cd命令,会回到/home/wade目录。因此直接敲入Downloads就能够进入到下载目录。
进入到Downloads目录后,输入以下指令将hadoop文件解压出来。
sudo tar xzf hadoop-2.7.0.tar.gz
而后使用下面的命令将解压后的目录移动到/usr/local/hadoop目录。
sudo mv hadoop-2.7.0 /usr/local/hadoop
接下来给前面创建的hadoop用户赋予相关的权限,不然hadoop用户没法配置这个目录下面的文件。
sudo chown -R hadoop:hadoop /usr/local/hadoop
接下来配置java home,首先经过以下命令肯定java的安装位置。
update-alternatives - -config java
其中/usr/lib/jvm/java-7-openjdk-amd64是咱们须要的部分。
接下来把这个配置到bashrc中,输入以下命令。
sudo gedit ~/.bashrc
系统会打开Gedit,而后把以下内容附加到文件的末尾。bashrc配置文件很重要,若是有差错会致使系统很大的问题。若是你的版本和前面的操做跟个人都同样的话,那么下面的配置内容是不须要更改的。
#HADOOP VARIABLES START
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
export HADOOP_INSTALL=/usr/local/hadoop
export PATH=$PATH:$HADOOP_INSTALL/bin
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"
#HADOOP VARIABLES END
配置以后的文件。点击Save后关闭。
接下来经过以下命令使配置生效。
source ~/.bashrc
再输入以下命令,配置hadoop的环境文件。
sudo gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh
找到export JAVA段,配置成以下内容。
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
配置后的文件以下图。
接下来经过以下命令让配置生效。
source /usr/local/hadoop/etc/hadoop/hadoop-env.sh
至此hadoop的配置工做完成。
接下来测试一下hadoop的环境,咱们将运行一个hadoop自带的程序WordCount。
这个应用咱们统计一下在hadoop目录下README.txt文件各个英文单词出现的次数。
首先使用如下命令定位到hadoop目录。
cd /usr/local/Hadoop
在这个目录下建立一个input文件夹。
sudo mkdir input
而后将README.txt文件夹复制到input文件夹下。
sudo cp README.txt input
而后运行以下命令开始统计。
sudo bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.7.0-sources.jar org.apache.hadoop.examples.WordCount input output
看到以下输出说明执行成功了。
输入以下命令查看统计结果。(cat命令是显示文本内容的命令,若是编辑文件的话在ubuntu desktop下能够用gedit,server下能够用vim)
cat output/*
至此hadoop单击模式搭建完毕。
参考博客:
http://www.cnblogs.com/maybe2030/p/4591195.html
http://www.cnblogs.com/kinglau/p/3794433.html
注:其中第一个地址的内容有些细节在我这里没法走通,因此我这里根据其要表达的意思作了相关的修正。