Spark wordcountはクラスタ実行に開発してコミットする
2609 ワード
使用するideはeclipseです
jarパッケージにエクスポートします.
クラスタ実行スクリプトにコミット: WordCount.sh
WordCount.shスクリプトの実行
package com.luogankun.spark.base
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
/**
*
*/
object WordCount {
def main(args: Array[String]) {
if (args.length < 1) {
System.err.println("Usage: <file>")
System.exit(1)
}
val conf = new SparkConf()
val sc = new SparkContext(conf)
val line = sc.textFile(args(0))
line.flatMap(_.split("\t")).map((_, 1)).reduceByKey(_+_).collect.foreach(println)
sc.stop
}
}
jarパッケージにエクスポートします.
クラスタ実行スクリプトにコミット: WordCount.sh
#!/bin/bash
set -x
cd $SPARK_HOME/bin
spark-submit \
--name WordCount \
--class com.luogankun.spark.base.WordCount \
--master spark://hadoop000:7077 \
--executor-memory 1G \
--total-executor-cores 1 \
/home/spark/lib/spark.jar \
hdfs://hadoop000:8020/hello.txt
WordCount.shスクリプトの実行