第一步在centos 6.5上安装java 运行环境html
http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.htmljava
第二步安装hadoop,去shell
http://hadoop.apache.org/上下一个apache
http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.5.0/hadoop-2.5.0.tar.gzcentos
解压缩便可oracle
第三步要装scala,去maven
http://www.scala-lang.org/download/上下一个oop
http://downloads.typesafe.com/scala/2.11.2/scala-2.11.2.rpm?_ga=1.193880237.1644075876.1409819439spa
在centos上直接rpm安装便可.net
第四步下载spark
http://spark.apache.org/downloads.html
根据本身的hadoop版本挑选一个预编译的spark,如(http://www.apache.org/dyn/closer.cgi/spark/spark-1.0.2/spark-1.0.2-bin-hadoop2.tgz),下完解压缩便可
或者下源码包本身编译(http://d3kbcqa49mib13.cloudfront.net/spark-1.0.2.tgz),本身编译maven可能被墙。
若是第四步选的是源码包,那还有第五步编译
即解压缩spark源码包之后,进入源代码目录执行sbt/sbt assembly,本身就会下载相应文件进行编译。
最后一步执行spark目录下的bin/spark-shell
在此以前记得打开hadoop的服务,否则在执行spark-shell的时候会报错
spark java.net.UnknownHostException: spark: spark: Name or service not known