Как исправить ошибку "java.lang.ClassNotFoundException: не удалось найти источник данных: kafka" в искровой Java - PullRequest
0 голосов
/ 28 января 2019

Я пишу приложение для пакетных заданий spark, которое будет считывать данные из темы kafka и отображать их содержимое.Ниже приведены подробности:

Запись POM для пакета, за которой следует код:

<dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-sql-kafka-0-10_2.11</artifactId>
        <version>2.3.1</version>
    </dependency>
<dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-core_2.11</artifactId>
        <version>2.1.0</version>
        <!--<scope>provided</scope>-->
    </dependency>
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-sql_2.11</artifactId>
        <version>2.1.0</version>
        <!--<scope>provided</scope>-->
    </dependency>

Dataset<Row> df = this.sparkSession
            .read()
            .format("kafka")
            .option("kafka.bootstrap.servers", "{SERVER_IP:PORT}")
            .option("key.deserializer", "KafkaAvroDeserializer")
            .option("value.deserializer", "KafkaAvroDeserializer")
            .option("group.id", "test")
            .option("auto.offset.reset", "earliest")
            .option("schema.registry.url", "http://{SERVER_IP:PORT}")
            .option("subscribe", "testTopic")
            .load();
    System.out.println("Data from kafka");
    df.show(10);

Я выполняю это задание по идее intellij.(Не используется искробезопасная отправка) Задание не выполняется со следующим исключением

java.lang.ClassNotFoundException: Failed to find data source: kafka. Please find packages at http://spark.apache.org/third-party-projects.html
at org.apache.spark.sql.execution.datasources.DataSource$.lookupDataSource(DataSource.scala:569)
at org.apache.spark.sql.execution.datasources.DataSource.providingClass$lzycompute(DataSource.scala:86)
at org.apache.spark.sql.execution.datasources.DataSource.providingClass(DataSource.scala:86)
at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:325)
at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:152)
at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:125)
at jobs.S3UploadPOC.internalProcess(S3UploadPOC.java:49)
at jobs.AbstractCronJob.process(AbstractCronJob.java:58)
at jobs.S3UploadPOC.main(S3UploadPOC.java:74)
Caused by: java.lang.ClassNotFoundException: kafka.DefaultSource
at java.net.URLClassLoader.findClass(URLClassLoader.java:381)
at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:349)
at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
at org.apache.spark.sql.execution.datasources.DataSource$$anonfun$25$$anonfun$apply$13.apply(DataSource.scala:554)
at org.apache.spark.sql.execution.datasources.DataSource$$anonfun$25$$anonfun$apply$13.apply(DataSource.scala:554)
at scala.util.Try$.apply(Try.scala:192)
at org.apache.spark.sql.execution.datasources.DataSource$$anonfun$25.apply(DataSource.scala:554)
at org.apache.spark.sql.execution.datasources.DataSource$$anonfun$25.apply(DataSource.scala:554)
at scala.util.Try.orElse(Try.scala:84)
at org.apache.spark.sql.execution.datasources.DataSource$.lookupDataSource(DataSource.scala:554)

Есть ли какой-либо пакет, который мне не хватает при настройке?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...