环境:ubuntu-16.04html
hadoop-2.6.0java
jdk1.8.0_161。web
spark-2.4.0-bin-hadoop2.6。这里的环境不必定须要和我同样,基本版本差很少都ok的,但注意这里spark要和hadoop版本相对应。所需安装包和压缩包自行下载便可。ubuntu
由于这里是配置spark的教程,首先必需要配置Hadoop,配置Hadoop的教程在Hadoop2.0伪分布式平台环境搭建。配置Java以及安装VMware Tools就自行百度解决哈,这里就不写了(由于教程有点长,可能有些地方有些错误,欢迎留言评论,我会在第一时间修改的)。vim
tar -zxvf spark-2.4.0-bin-hadoop2.6
cd spark-2.4.0-bin-hadoop2.6/ cd conf/ cp spark-env.sh.template spark-env.sh
而后在spark-env.sh文件最后添加内容 bash
vim spark-env.sh
vim ~/.bashrc
在文件最后加入spark的路径分布式
保存使其当即生效。oop
source ~/.bashrc
cd .. sbin/start-all.sh
jps查看进程post
出现上面这些节点说明搭建成功。ui
http://localhost:8080/
退出命令为 :quit 。