【Spark亚太研究院系列丛书】Spark实战高手之路-第一章构建Spark集群（第五步）（1）

时间 2019-11-07

标签 Spark亚太研究院系列丛书 spark 实战高手之路第一章构建集群第五栏目 Spark 繁體版

原文原文链接

第一步：构造分布式Hadoop2.2.0集群

1,在Windows 7（本教程中的Spark集群运行的机器是8G的Windows内存）上安装VMware虚拟机（咱们安装的是VMware-workstation-full-9.0.2），本教程中的VMware Workstation下载地址：html

https://my.vmware.com/cn/web/vmware/details?downloadGroup=WKST-902-WIN&productId=293&rPId=3526java

2,在VMvare中装三台Ubuntu机器（咱们使用的是ubuntu-12.10-desktop-i386），每台机器分配2G的内存，本教程中Ubuntu下载地址：web

http://www.ubuntu.org.cn/download/desktop/alternative-downloadsapache

;font-� � l : ��E 0D �黑","sans-serif"'>ubuntu

1,在Windows 7（本教程中的Spark集群运行的机器是8G的Windows内存）上安装VMware虚拟机（咱们安装的是VMware-workstation-full-9.0.2），本教程中的VMware Workstation下载地址：vim

https://my.vmware.com/cn/web/vmware/details?downloadGroup=WKST-902-WIN&productId=293&rPId=3526session

3,分别在三台Ubuntu机器中设置root用户机器密码，之后每次登陆的时候都是用root用户登陆，具体设置方式以下：oracle

sudo -s进入 root用户权限模式ssh
vim /etc/lightdm/lightdm.conf分布式

[SeatDefaults]

greeter-session=unity-greeter

user-session=Ubuntu

greeter-show-manual-login=true

allow-guest=false

启动root账号：
sudo passwd root

三台机器修改后，再次登陆系统的时候用root用户登陆：

4,配置三台机器的/etc/hosts和/etc/hostname并安装ssh设置三台机器之间的无密码登陆，具体步骤可参考Spark实战高手之路-第一章的第一节 http://t.cn/RPo13rO 和Spark实战高手之路第一章的第二节http://t.cn/RP9klmr 咱们在“/etc/hostname”文件中把三台机器的hostname分别设置了SparkMaster、SparkWorker一、SparkWorker2并在每台机器的“/etc/hosts”配置以下IP和机器名称的对应关系：

配置好三天机器相互通讯的ssh后会发现三台机器能够相互使用ssh无密码登陆：

5,在三台Ubuntu机器上安装Java，在这里咱们使用的是jdk1.7.0_67(下载地址 http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html )

具体的安装和配置方法请参考Spark实战高手之路-第一章的第一节 http://t.cn/RPo13rO

安装完成的能够验证一下：

三台Ubuntu机器分别出现上述信息就代表Java安装正确。

6,在SparkMaster这台机器上安装Hadoop 2.2.0,Hadoop 2.2.0的下载地址为：

http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.2.0/

咱们下载的是“hadoop-2.2.0.tar.gz  ”，以下图所示：

【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群（第五步）（1）

第一步：构造分布式Hadoop2.2.0集群

【Spark亚太研究院系列丛书】Spark实战高手之路-第一章构建Spark集群（第五步）（1）