spark单一部署版

1809 查看

再记录一下spark的单机版部署
最后可以跑通spark自带的例子,不过可能有些参数还需要调整
假设你已经部署好了hadoop
首先下载scala和spark

scala: http://www.scala-lang.org/download/
spark: http://spark.apache.org/downloads.html

然后先要安装scala:

scale的安装很简单,解压后,配置一下环境变量就可以直接使用
修改/etc/profile
export SCALA_HOME=/usr/lib/scala-2.9.3
export PATH=$PATH:$SCALA_HOME/bin

测试:
  source /etc/profile
  scala -version

安装好之后再安装spark,也是无需安装,关键是配置:

修改/etc/profile
export SPARK_EXAMPLES_JAR=${SPARK_HOME}/lib/spark-examples-1.3.1-hadoop2.6.0.jar
export SPARK_HOME=/usr/local/spark
export PATH=$PATH:${SPARK_HOME}/bin

修改spark-env.sh
cp spark-env.sh.template spark-env.sh
添加如下内容:
    export SPARK_LAUNCH_WITH_SCALA=0
    export SPARK_LIBRARY_PATH=${SPARK_HOME}/lib
    export SCALA_LIBRARY_PATH=${SPARK_HOME}/lib
    export SPARK_MASTER_WEBUI_PORT=18080
    export SPARK_MASTER_IP=localhost#需要配置一下,而且要跟spark-env.sh一致
    export SPARK_MASTER_PORT=7077
    export SPARK_WORKER_PORT=7078
    export SPARK_WORKER_WEBUI_PORT=18081
    export SPARK_WORKER_DIR=${SPARK_HOME}/work
    export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
    export SPARK_LOCAL_IP=2.2.2.2
    export SPARK_LOCAL_DIRS=${SPARK_HOME}/data

修改spark-defaults.conf
cp spark-defaults.conf.template spark-defaults.conf

    spark.eventLog.dir=/user/spark/applicationHistory
    spark.eventLog.enabled=true
    spark.master=spark://localhost:7077
    spark.eventLog.dir=/user/spark/applicationHistory
    spark.eventLog.enabled=true
    spark.yarn.historyServer.address=http://localhost:19888

都改好之后可以试试启动spark服务

${SPARK_HOME}/sbin/start-master.sh
${SPARK_HOME}/sbin/start-slaves.sh

如果不能启动的话,可能是spark-class有些配置没弄好

正常启动后运行
    ${SPARK_HOME}/bin/run-example SparkPi 10
会输出
    Pi is roughly 3.14366

这里讲的都是基本的spark配置和例子的运行,接下来会使用更多的例子测试