Я перехожу по ссылке ниже, чтобы создать простое искровое задание в Java.
https://www.datasciencebytes.com/bytes/2016/04/18/getting-started-with-spark-running-a-simple-spark-job-in-java/
Ниже приведен мой Java-файл:
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import java.io.IOException;
public class SparkAppMain {
public static void main(String[] args) throws IOException {
SparkConf sparkConf = new SparkConf()
.setAppName("Example Spark App")
.setMaster("local[*]"); // Delete this line when submitting to a cluster
JavaSparkContext sparkContext = new JavaSparkContext(sparkConf);
JavaRDD<String> stringJavaRDD = sparkContext.textFile("/tmp/nationalparks.csv");
System.out.println("Number of lines in file = " + stringJavaRDD.count());
}
}
И ниже мой файл POM.xml:
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>edu.berkeley</groupId>
<artifactId>simple-project</artifactId>
<version>1.0-SNAPSHOT</version>
<dependencies>
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-core_2.10</artifactId>
<version>1.6.1</version>
</dependency>
<dependency>
<groupId>org.scala-lang</groupId>
<artifactId>scala-library</artifactId>
<version>2.10.3</version>
</dependency>
<dependency>
<groupId>io.netty</groupId>
<artifactId>netty-all</artifactId>
<version>4.1.5.Final</version>
</dependency>
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-actor_2.10</artifactId>
<version>2.2.1</version>
</dependency>
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-streaming_2.10</artifactId>
<version>1.6.1</version>
</dependency>
</dependencies>
</project>
Я пробовал решение, как версия с потоковой передачей искры должна быть такой же, как и у spark-core (1.5.2).То же самое для spark-streaming-kafka_2.10.