У меня уже есть созданный SparkContext и глобальная переменная Spark. Когда я читаю файлы ORC, я могу прочитать их так же просто, как spark.read.format("orc").load("filepath")
, однако, для avro я не могу сделать то же самое, хотя пытаюсь импортировать банку так:
spark.conf.set("spark.jars.packages",
"file:///projects/apps/lib/spark-avro_2.11-3.2.0.jar")
Ошибка:
and then try to read the avro file. I get an error like so:
Py4JJavaError: An error occurred while calling o65.load.
: org.apache.spark.sql.AnalysisException: Failed to find data source: avro. Please find an Avro package at http://spark.apache.org/third-party-projects.html;