Интеграция искры и кафки, исключение в Spark-представить банку - PullRequest
0 голосов
/ 14 июня 2019

Получает NullPointerException при отправке файла jar , который объединяет kafka с искрой под Ubuntu . Я пытаюсь запустить код на https://github.com/apache/spark/tree/v2.1.1/examples

Я попытался проверить, требуется ли для установки спарк под Ubuntu требуется установить HADOOP_HOME ; Однако HADOOP_HOME не установлен, тщательно проверил аргументы jar.

./bin/spark-submit --class "org.apache.spark.examples.streaming.JavaKafkaWordCount" --packages org.apache.spark:spark-streaming-kafka-0-10_2.11:2.1.0 --master local[*] --jars ~/software/JavaKafkaWordCount.jar localhost:2181 test-consumer-group streams-plaintext-input 1

Исключение в потоке "main" java.lang.NullPointerException в org.apache.hadoop.fs.Path.getName (Path.java:337) в org.apache.spark.deploy.DependencyUtils $ .downloadFile (DependencyUtils.scala: 136) в org.apache.spark.deploy.SparkSubmit $$ anonfun $ prepareSubmitEnvironment $ 7.Apply (SparkSubmit.scala: 367) в org.apache.spark.deploy.SparkSubmit $$ anonfun $ prepareSubmitEnvironment $ 7.Apply (SparkSubmit.scala: 367) в scala.Option.map (Option.scala: 146) в org.apache.spark.deploy.SparkSubmit.prepareSubmitEnvironment (SparkSubmit.scala: 366) в org.apache.spark.deploy.SparkSubmit.submit (SparkSubmit.scala: 143) в org.apache.spark.deploy.SparkSubmit.doSubmit (SparkSubmit.scala: 86) в org.apache.spark.deploy.SparkSubmit $$ Анон $ 2.doSubmit (SparkSubmit.scala: 924) в org.apache.spark.deploy.SparkSubmit $ .main (SparkSubmit.scala: 933) в org.apache.spark.deploy.SparkSubmit.main (SparkSubmit.scala)

1 Ответ

2 голосов
/ 14 июня 2019

Ваш путь к Uri Jar не понятен, см. this DependencyUtils.scala # L136

 /**
   * Download a file from the remote to a local temporary directory. If the input path points to
   * a local path, returns it with no operation.
   *
   * @param path A file path from where the files will be downloaded.
   * @param targetDir A temporary directory for which downloaded files.
   * @param sparkConf Spark configuration.
   * @param hadoopConf Hadoop configuration.
   * @param secMgr Spark security manager.
   * @return Path to the local file.
   */
  def downloadFile(
      path: String,
      targetDir: File,
      sparkConf: SparkConf,
      hadoopConf: Configuration,
      secMgr: SecurityManager): String = {
    require(path != null, "path cannot be null.")
    val uri = Utils.resolveURI(path)

    uri.getScheme match {
      case "file" | "local" => path
      case "http" | "https" | "ftp" if Utils.isTesting =>
        // This is only used for SparkSubmitSuite unit test. Instead of downloading file remotely,
        // return a dummy local path instead.
        val file = new File(uri.getPath)
        new File(targetDir, file.getName).toURI.toString
      case _ =>
        val fname = new Path(uri).getName()
        val localFile = Utils.doFetchFile(uri.toString(), targetDir, fname, sparkConf, secMgr,
          hadoopConf)
        localFile.toURI().toString()
    }
  }

В вашей искровой подаче измените аргументы следующим образом

--jars /fullpath/JavaKafkaWordCount.jar вместо --jars ~/software/JavaKafkaWordCount.jar

...