Эта библиотека Databricks является открытым исходным кодом, но фактически была добавлена в ядро Spark в 2.4 (хотя все еще является внешней библиотекой)
В любом случае, есть собственная библиотека Python avro, а также fastavro, поэтому я не совсем уверен, хотите ли вы запускать JVM (потому что вы используете Spark), просто для загрузки данных Avro в словарь. Кроме того, файл Avro состоит из нескольких записей, поэтому он будет, по крайней мере, списком словарей
В принципе, я думаю, что вам лучше использовать подход из предыдущего вопроса, но начните с записи данных Avro на диск, поскольку это, кажется, ваша текущая проблема
В противном случае, возможно, немного больше поиска того, что вы ищете, решит эту проблему XY у вас
https://github.com/ynqa/pandavro