У меня есть файл, который я могу правильно прочитать следующим образом:
sqlContext.read.format('csv').options(header='false', inferSchema='true', delimiter = "\a", nullValue = '\\N').load('adl://resource.azuredatalakestore.net/datalake-prod/raw/something/data/something/date_part={}/{}'.format(elem[0], elem[1]))
проблема в том, что заголовка нет, заголовок фактически находится в другом файле типа avsc
, объект схемы Apache Avro.
Как лучше всего использовать его в качестве заголовка моего DF?
Я запускаю pyspark на Azure Databricks.