Учитывая, что файлы Avro и Parquet содержат и данные, и схему для этих данных, то в Spark должна быть возможность считывать эти файлы как набор данных, а не как DataFrame.Но все источники, которые я вижу, читают эти файлы как DataFrame, и я никак не могу прочитать эти файлы как набор данных.
Кто-нибудь знает, как читать эти файлы как наборы данных?