Я пытаюсь прочитать файл avro в блокноте jupyter, но столкнулся с этой проблемой.
Caused by: java.lang.ClassNotFoundException: org.apache.spark.sql.avro.AvroFileFormat.DefaultSource
и я не могу понять, откуда взялась эта зависимость.
import findspark
findspark.init()
import pyspark
from pyspark.sql import SparkSession
from pyspark.sql.types import *
spark = SparkSession.builder.appName("readavro").master("local").getOrCreate()
result = spark.read.format('com.databricks.spark.avro').load("file:///C:/Downloads/part-r-00000.avro")