ubuntu版本------ubuntukylin-14.04.2 64位版本 java
Hadoop版本------Hadoop2.6.4-release linux
虚拟机版本-------VMware Workstation Pro 12.0 shell
Jvm版本---------Jdk1.7以上 ubuntu
虚拟机安装ubuntu时安装完一个虚拟机后可选择clone直接复制出来相同的克隆版本省去安装时间 centos
安装ubuntu并创建hadoop用户,为后续集群ssh通道作预备,不建议使用root用户进行一系列操做,具体缘由百度,root远程可对系统资源进行任意修改,切记,具体shell脚本以下 安全
groupadd hadoop useradd -mg hadoop hadoop #-m指的是在/home/目录下新建一个与用户名相同的文件夹 #-g指的是添加用户组 passwd hadoop #回车后将密码设置成123456 ps:密码限于开发调试,生产环境切勿大意,设立复杂度高密码保障安全
下载Java对应版本的tar.gz包以下图所示 运维
Ps:centos下 下载rpm包可直接使用RPM命令进行安装,ubuntu下建议使用gz包进行安装,笔者尝试安装rpm插件进行rpm安装,把系统搞残了 有经验的大神欢迎留言指导,谢过了 ssh
在/usr/lib目录下新建jvm目录,将gz包解压到/usr/lib/jvm目录下,并将java-***包重命名为java 重命名命令 jvm
Mv java-***** java ide
打开环境变量预执行文件 gedit /etc/profile
添加这几行环境变量
export JAVA_HOME=/usr/lib/jvm/java export JRE_HOME=${JAVA_HOME}/jre export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib export PATH=${JAVA_HOME}/bin:$PATH
输入命令后重启系统或者直接执行source /etc/profile 执行预加载脚本变量
输入命令java -version 打印出现如上图所示版本信息,表明jdk安装成功
进入hadoop脚本环境配置文件
gedit /opt/hadoop/hadoop/etc/hadoop/hadoop-env.sh
将JAVA_HOME修改成绝对路径.
Ps:至于为何默认配置的${JAVA_HOME}不起做用,笔者暂时未找到缘由欢迎大神们进行补充
#配置hadoop ssh 无密码登陆 --需求背景,因为hadoop集群动辙几十上百台机器进行集群计算
假如进行密钥输入认证会增长许多运维的工做量,因此社区内广泛进行公有密钥进行交换比对登陆
进入hadoop用户home目录 /home/hadoop/ 找到 .ssh 目录没有则新建,注意将文件夹全部权修改成hadoop用户全部
安装ssh服务
sudo apt-get install openssh-server sudo apt-get install openssh-client
尝试输入命令ssh localhost 出现输入密码界面则表明ssh服务端与客户端安装成功
l 配置免密码登陆
进入hadoop用户home目录下
cd /home/hadoop
能看见.sshwe文件夹,进入.ssh文件夹
执行一下命令生成ssh免登陆的公钥和私钥
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
这个命令会在.ssh文件夹下建立id_dsa和id_dsa.pub两个文件,这是SSH的一对私钥和公钥
如今把id_dsa.pub追加到公钥中去,执行如下命令
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
如今切换到hadoop用户登陆,在尝试用ssh进行远程链接
ssh localhost是否是获得如下画面
表明免登陆配置成功
进入hadoop目录/opt/hadoop/hadoop/
执行./sbin/start-all.sh 脚本启动hadoop
因为是单机运行hadoop,nameNode 和 Jobtracker都没有启动如何查看hadoop是否启动呢?
查看HDFS文件系统
./bin/hadoop fs -ls /
出现以上信息,恭喜,表明你单机安装hadoop成功。Hdfs文件结构就是如linux同样
下一章推出hadoop伪单机集群模式,敬请期待,各位看官有哪不懂或者有疑问,欢迎留言