Windows下搭建spark

2033 查看

安装环境

JDK 1.7
scala 2.11.7
hadoop-winutils 2.6.0
spark 1.3.1

安装步骤

安装JDK、scala解释器、hadoop-winutils、spark
配置JAVA_HOME、SCALA_HOME、HADOOP_HOME环境变量
运行spark目录下/bin/spark-shell.cmd

测试代码

用这里的wordCount代码，在spark-shell上运行

scala$ spark-shell
scala> val file = sc.textFile("<input file>")
scala> val counts = file.flatMap(line => line.split(" ")).map(word => (word, 1)).reduceByKey(_ + _)
scala> counts.saveAsTextFile("<output file>")

可以在<output file>/part-00000（可能不只一个输出结果文件）中看到结果

最近更新的内容

使用IntelliJ IDEA配置Spark应用开发环境及源码阅读环境（基础）
大数据学习资源整理
Spark Learn Part01 introduce and install
spark自带的kmeans例子分析
spark运行python代码
spark自带的python例子的分析
个推 Spark实践教你绕过开发那些“坑”
使用 Spark 进行微服务的实时性能分析
Spark Streaming
Apache Spark 的一些浅见。

你可能感兴趣的文章

Spark Machine Learning 02 design machine learning system
快学Scala初级A1整理(1)
spark运行python代码
spark简单wordcount实例
spark自带的python例子的分析
spark自带的kmeans例子分析
Apache Spark 的一些浅见。
大数据学习资源整理
新手入门：Spark部署实战入门
搭建Spark集群？没想到你是这样的k8s

2025 - 快车库 - 我的知识库重庆启连科技有限公司渝ICP备16002641号-10
企客连连表单助手企服开发榜单123

渝公网安备 50010702501581号