spark单一部署版

时间 2019-12-05

标签 spark 单一部署栏目 Spark 繁體版

原文原文链接

再记录一下spark的单机版部署
最后能够跑通spark自带的例子，不过可能有些参数还须要调整
假设你已经部署好了hadoop
首先下载scala和sparkhtml

scala: http://www.scala-lang.org/download/
spark: http://spark.apache.org/downloads.html

而后先要安装scala:apache

scale的安装很简单，解压后，配置一下环境变量就能够直接使用
修改/etc/profile
export SCALA_HOME=/usr/lib/scala-2.9.3
export PATH=$PATH:$SCALA_HOME/bin

测试：
  source /etc/profile
  scala -version

安装好以后再安装spark，也是无需安装，关键是配置：app

修改/etc/profile
export SPARK_EXAMPLES_JAR=${SPARK_HOME}/lib/spark-examples-1.3.1-hadoop2.6.0.jar
export SPARK_HOME=/usr/local/spark
export PATH=$PATH:${SPARK_HOME}/bin

修改spark-env.sh
cp spark-env.sh.template spark-env.sh
添加以下内容：
    export SPARK_LAUNCH_WITH_SCALA=0
    export SPARK_LIBRARY_PATH=${SPARK_HOME}/lib
    export SCALA_LIBRARY_PATH=${SPARK_HOME}/lib
    export SPARK_MASTER_WEBUI_PORT=18080
    export SPARK_MASTER_IP=localhost#须要配置一下，并且要跟spark-env.sh一致
    export SPARK_MASTER_PORT=7077
    export SPARK_WORKER_PORT=7078
    export SPARK_WORKER_WEBUI_PORT=18081
    export SPARK_WORKER_DIR=${SPARK_HOME}/work
    export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
    export SPARK_LOCAL_IP=2.2.2.2
    export SPARK_LOCAL_DIRS=${SPARK_HOME}/data

修改spark-defaults.conf
cp spark-defaults.conf.template spark-defaults.conf

    spark.eventLog.dir=/user/spark/applicationHistory
    spark.eventLog.enabled=true
    spark.master=spark://localhost:7077
    spark.eventLog.dir=/user/spark/applicationHistory
    spark.eventLog.enabled=true
    spark.yarn.historyServer.address=http://localhost:19888

都改好以后能够试试启动spark服务oop

${SPARK_HOME}/sbin/start-master.sh
${SPARK_HOME}/sbin/start-slaves.sh

若是不能启动的话，多是spark-class有些配置没弄好

正常启动后运行
    ${SPARK_HOME}/bin/run-example SparkPi 10
会输出
    Pi is roughly 3.14366

这里讲的都是基本的spark配置和例子的运行，接下来会使用更多的例子测试测试