Проблема с созданием DataFrame в формате avro - PullRequest
0 голосов
/ 06 августа 2020

Я пытаюсь создать фрейм данных с форматом avro o и мгновенным сжатием.

ниже используется код. В папке val ordersDF = spark.read.format(“avro”).load("/user/spark_learner/practice1/question3") question3 есть 4 файла с расширением .avro.

Когда я запускаю эту команду в spark2-shell, я получаю ошибку ниже. Не могу понять, в чем именно заключается проблема. Пожалуйста, предложите.

ava.lang.NoSuchMethodError: org.apache.spark.sql.internal.SQLConf.avroCompressionCodec()Ljava/lang/String;
at org.apache.spark.sql.avro.AvroOptions$$anonfun$5.apply(AvroOptions.scala:80)
at org.apache.spark.sql.avro.AvroOptions$$anonfun$5.apply(AvroOptions.scala:80)
at scala.Option.getOrElse(Option.scala:121)
at org.apache.spark.sql.avro.AvroOptions.(AvroOptions.scala:80)
at org.apache.spark.sql.avro.AvroOptions.(AvroOptions.scala:34)
at org.apache.spark.sql.avro.AvroFileFormat.inferSchema(AvroFileFormat.scala:60)
at org.apache.spark.sql.execution.datasources.DataSource$$anonfun$8.apply(DataSource.scala:202)
at org.apache.spark.sql.execution.datasources.DataSource$$anonfun$8.apply(DataSource.scala:202)
at scala.Option.orElse(Option.scala:289)
at org.apache.spark.sql.execution.datasources.DataSource.getOrInferFileFormatSchema(DataSource.scala:201)
at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:392)
at org.apache.spark.sql.DataFrameReader.loadV1Source(DataFrameReader.scala:239)
at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:227)
at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:174)
… 49 elided
...