再记录一下spark的单机版部署
最后能够跑通spark自带的例子,不过可能有些参数还须要调整
假设你已经部署好了hadoop
首先下载scala和sparkhtml
scala: http://www.scala-lang.org/download/ spark: http://spark.apache.org/downloads.html
而后先要安装scala:apache
scale的安装很简单,解压后,配置一下环境变量就能够直接使用 修改/etc/profile export SCALA_HOME=/usr/lib/scala-2.9.3 export PATH=$PATH:$SCALA_HOME/bin 测试: source /etc/profile scala -version
安装好以后再安装spark,也是无需安装,关键是配置:app
修改/etc/profile export SPARK_EXAMPLES_JAR=${SPARK_HOME}/lib/spark-examples-1.3.1-hadoop2.6.0.jar export SPARK_HOME=/usr/local/spark export PATH=$PATH:${SPARK_HOME}/bin 修改spark-env.sh cp spark-env.sh.template spark-env.sh 添加以下内容: export SPARK_LAUNCH_WITH_SCALA=0 export SPARK_LIBRARY_PATH=${SPARK_HOME}/lib export SCALA_LIBRARY_PATH=${SPARK_HOME}/lib export SPARK_MASTER_WEBUI_PORT=18080 export SPARK_MASTER_IP=localhost#须要配置一下,并且要跟spark-env.sh一致 export SPARK_MASTER_PORT=7077 export SPARK_WORKER_PORT=7078 export SPARK_WORKER_WEBUI_PORT=18081 export SPARK_WORKER_DIR=${SPARK_HOME}/work export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop export SPARK_LOCAL_IP=2.2.2.2 export SPARK_LOCAL_DIRS=${SPARK_HOME}/data 修改spark-defaults.conf cp spark-defaults.conf.template spark-defaults.conf spark.eventLog.dir=/user/spark/applicationHistory spark.eventLog.enabled=true spark.master=spark://localhost:7077 spark.eventLog.dir=/user/spark/applicationHistory spark.eventLog.enabled=true spark.yarn.historyServer.address=http://localhost:19888
都改好以后能够试试启动spark服务oop
${SPARK_HOME}/sbin/start-master.sh ${SPARK_HOME}/sbin/start-slaves.sh 若是不能启动的话,多是spark-class有些配置没弄好 正常启动后运行 ${SPARK_HOME}/bin/run-example SparkPi 10 会输出 Pi is roughly 3.14366
这里讲的都是基本的spark配置和例子的运行,接下来会使用更多的例子测试测试