centos+scala2.11.4+hadoop2.3+spark1.3.1环境搭建

时间 2019-11-06

标签 centos+scala2.11.4+hadoop2.3+spark1.3.1 centos scala hadoop spark 环境搭建栏目 CentOS 繁體版

原文原文链接

1、Java安装

一、安装包准备：html

首先到官网下载jdk，http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html，我下载jdk-7u79-linux-x64.tar.gz，下载到主目录java

二、解压安装包linux

经过终端在/usr/local目录下新建java文件夹，命令行：数据库

sudo mkdir /usr/local/java

而后将下载到压缩包拷贝到java文件夹中，命令行：apache

进入jdk压缩包所在目录oracle

cp jdk-7u79-linux-x64.tar.gz /usr/local/java

而后进入java目录，命令行：ssh

cd /usr/local/java

解压压缩包，命令行：oop

sudo tar xvf jdk-7u79-linux-x64.tar.gz

而后能够把压缩包删除，命令行：ui

sudo rm jdk-7u79-linux-x64.tar.gz

三、设置jdk环境变量spa

这里采用全局设置方法，就是修改etc/profile，它是是全部用户的共用的环境变量

sudo vi /etc/profile

打开以后在末尾添加

export JAVA_HOME=/usr/local/java/jdk1.7.0_79
export JRE_HOME=/usr/local/java/jdk1.7.0_79/jre
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin: $PATH

使profile生效

source /etc/profile

四、检验是否安装成功

在终端

java -version

显示以下

java version "1.7.0_79"
Java(TM) SE Runtime Environment (build 1.7.0_79-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.79-b02, mixed mode)

PS:后来发现直接rpm包jdk-7u79-linux-x64.rpm桌面双击安装也OK，^_^

2、scala2.11.4安装

一、安装包准备：

首先到官网下载scala，http://www.scala-lang.org/，下载scala-2.11.4.tgz，并复制到/usr/bib

二、解压安装包

tar -zxf scala-2.11.4.tgz

三、设置scala环境变量

这里采用全局设置方法，就是修改etc/profile，它是是全部用户的共用的环境变量

sudo vi /etc/profile

打开以后在末尾添加

export SCALA_HOME=/usr/lib/scala-2.11.4
export PATH=$SCALA_HOME/bin:$PATH

使profile生效

source /etc/profile

四、检验是否安装成功

在终端

scala -version

显示以下

3、hadoop2.3安装

一、安装包准备：

hadoop版本有点混乱，除了http://hadoop.apache.org/有众多版本以外，还有Cloudera公司的CDH版本，请从观望下载hadoop-2.3.0.tar.gz或者下载CDH版本hadoop-2.3.0-cdh5.0.0.tar.gz，本文环境是在hadoop-2.3.0-cdh5.0.0.tar.gz之上创建。

二、解压安装包

下载安装包以后复制到/usr目录。

tar -zxf hadoop-2.3.0-cdh5.0.0.tar.gz

解压后生成hadoop-2.3.0-cdh5.0.0，重命名为hadoop-2.3.0。

三、配置环境

这里采用全局设置方法，就是修改etc/profile，它是是全部用户的共用的环境变量

sudo vi /etc/profile

打开以后在末尾添加

export HADOOP_HOME=/home/zero/hadoop/hadoop-2.3.0

export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

使profile生效

source /etc/profile

三、创建hadoop用户

useradd hadoop

passwd hadoop

三、配置SSH免登陆

su hadoop //切换到hadoop用户目录下

ssh-keygen-t rsa(一路回车生成密钥)

cd/home/hadoop/.ssh/

scp id_rsa.pub hadoop@slave1:/home/hadoop/.ssh/

mv id_rsa.pub authorized_keys

4、spark1.3.1安装

一、安装包准备：

spark官网下载spark-1.3.1-bin-hadoop2.3.tgz。

二、解压安装包

下载安装包以后复制到/usr目录。

tar -zxf spark-1.3.1-bin-hadoop2.3.tgz

解压后生成spark-1.3.1-bin-hadoop2.3，重命名为spark-1.3.1-hadoop2.3。

三、配置环境

这里采用全局设置方法，就是修改etc/profile，它是是全部用户的共用的环境变量

sudo vi /etc/profile

打开以后在末尾添加

export SPARK_HOME=/usr/spark-1.3.1-hadoop2.3
export PATH=$SPARK_HOME/bin:$PATH

使profile生效

source /etc/profile

四、配置环境

这里采用全局设置方法，就是修改etc/profile，它是是全部用户的共用的环境变量

sudo vi /etc/profile

打开以后在末尾添加

export SPARK_HOME=/usr/spark-1.3.1-hadoop2.3
export PATH=$SPARK_HOME/bin:$PATH

使profile生效

source /etc/profile

配置Spark环境变量

cd $SPARK_HOME/conf
cp spark-env.sh.template spark-env.sh

vi spark-env.sh 添加如下内容：

export JAVA_HOME=/usr/local/java-1.7.0_79
export HADOOP_HOME=/usr/hadoop-2.3.0

export HADOOP_CONF_DIR=/etc/hadoop/conf
export SCALA_HOME=/usr/lib/scala-2.11.4
export SPARK_HOME=/usr/spark-1.3.1-hadoop2.3
export SPARK_MASTER_IP=127.0.0.1
export SPARK_MASTER_PORT=7077
export SPARK_MASTER_WEBUI_PORT=8099
 
export SPARK_WORKER_CORES=3 //每一个Worker使用的CPU核数
export SPARK_WORKER_INSTANCES=1 //每一个Slave中启动几个Worker实例
export SPARK_WORKER_MEMORY=10G //每一个Worker使用多大的内存
export SPARK_WORKER_WEBUI_PORT=8081 //Worker的WebUI端口号
export SPARK_EXECUTOR_CORES=1 //每一个Executor使用使用的核数
export SPARK_EXECUTOR_MEMORY=1G //每一个Executor使用的内存

export SPARK_CLASSPATH=/usr/spark-1.3.1-hadoop2.3/lib/sequoiadb-driver-1.12.jar:/usr/spark-1.3.1-hadoop2.3/lib/spark-sequoiadb_2.11.2-1.12.jar //使用巨衫数据库
export SPARK_CLASSPATH=$SPARK_CLASSPATH:$CLASSPATH
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:$HADOOP_HOME/lib/nativ

配置Slave

cp slaves.template slaves
vi slaves 添加如下内容：
localhost

五、启动Spark Master

cd $SPARK_HOME/sbin/
./start-master.sh

六、启动Spark Slave

cd $SPARK_HOME/sbin/./start-slaves.sh