简介html
Hadoop是Apache开发的一个用于大规模分布式计算的开源工程。主页地址:http://hadoop.apache.org/。apache
安装windows
在windows上安装Hadoop文档:http://wenku.baidu.com/view/6af47921af45b307e8719799.htmlssh
简单介绍下步骤吧分布式
Step 1. 安装cygwin,cygwin是在windows的平台上模拟Linux环境的虚拟机。要注意安装的时候cygwin的安装组件最好全选,由于之后再加比较麻烦。oop
Step 2. 使用cygwin安装sshd服务。文档:http://ebiquity.umbc.edu/Tutorials/Hadoop/05%20-%20Setup%20SSHD.html网站
安装指令:ssh-host-configui
由于第一次使用安装cygwin的时候cygwin的窗口被我直接叉掉了(注意win7下面必须用管理员权限打开cygwin!!),因此后面都须要overwrite一些已生成的文件。xml
截图以下:htm
有问到权限分离,具体是什么意思也不清楚,可是在说明文档里特别讲了填no。
问是否要安装ssh,选择yes,然后会出现“Enter the value of CYGWIN for the daemon: []”,填上 ntsec
以后问是否要用一个不一样的名字,选了no,后面的那个选了yes
然后就是键入密码什么的,最后出现了have fun!这个词,你就成功了~~
安装成功sshd后须要启动sshd服务,路径:计算机-管理-服务和应用程序-服务-cygwin sshd-右键启动。
Step 3. 配置ssh登陆
在cygwin中使用ssh-keygen生成密钥文件,以下图所示:(一直按回车知道出现下面的那张大图,三次回车)
以后以下图操做(跟着文档的步骤走的)
完成上面步骤后,写入exit,退出cygwin(若是不那么作会出问题,是否是由于在ssh的目录下?)
从新打开cygwin,输入 ssh localhost,在问是否继续的时候回答yes。 以后就会打出一张图片,颇有爱哦~
Step 4. 下载hadoop安装包:
在hadoop网站上找到下载的端口(common):http://www.apache.org/dyn/closer.cgi/hadoop/common/
在里面能够找到离本身最近的下载点(看到有北京交通大学的镜像,这个挺近的):http://mirror.bjtu.edu.cn/apache//hadoop/common/
下载了2.3.0,就随便下了个版本,hadoop-0.23.0.tar.gz,59.43M。
Step 5. 安装hadoop
1. 将hadoop解压到自定义的目录,D:\Useful Software\Software Installed\hadoop\run
2. 修改hadoop中文件的配置
将JAVA_HOME设为JDK的目录便可,JDK版本必须大于1.6