最近想看一下hadoop ,万事开头难因此先从环境搭建入手可是网上的帖子都是针对hadoop 0.x版本的,对于我这样的小白起了一些误导做用折腾了半天终于看到小象,遂做此记录。java
准备环境:linux
linux 系统(本次使用centos 6.0)shell
Java开发环境(采用jdk6)vim
opensshcentos
hadoop 2.0.3浏览器
你们能够从官方下载,我提供网盘下载jdk、hadoop:http://pan.baidu.com/s/1ACIjpssh
个人全部操做均在vbox虚拟机中为了不内外环境切换,有用到了xshell远程工具。(不过非必须软件)分布式
1)安装openssh工具
openssh 在装系统时已经装上啦。(这样才能用xshell远程链接到linux)oop
若是没有安装能够联机安装:#:yum install ssh
查看是否安装ssh或安装是否成功
2)安装jdk
操做以下:
切换系统默认jdk(系统默认jdk是openjdk),此处显示可能不一样但只要选最大的数字就行也就是咱们刚配置的路径。
配置系统变量:#:vim /etc/profile
重启配置项:#:source /etc/profile
验证安装是否成功
3)安装hadoop
首先配置ssh为免密码登陆
测试链接
解压hadoop到/usr/目录下
作软链接
修改配置文件
在开始添加以下语句,由于hadoop是基于java语言的因此须要将JAVA_HOME变量配置以下,这也是为何要先装jdk的缘由。
修改core-site.xml
修改以下,配置HDFS(分布式文件系统)的地址及端口号
修改hdfs-site.xml
由于hadoop有三种运行方式:单机模式、伪分布式、彻底分布式。在此配置为1即单机模式
修改mapred-site.xml
此文件为MapReduce的配置文件,用于配置JobTracker的地址及端口
格式化文件系统HDFS
启动全部服务(也可用sbin/start-x.sh来单独启动某个单独服务)
查看服务是否都启动啦
而后在浏览器中敲入网址:localhost:8088浏览
可是个人虚拟机没有安装xwindow因此只能在本地远程看可是因为有防火墙限制因此没办法看到,在此我只是演示因此直接暂时关闭防火墙
而后在本地敲入远程网址在本地就能够查看啦
以上都正常后则说明环境搭建完成。