Похоже, вы должны принудительно установить schema
при чтении файлов.Я предполагаю, что у вас есть что-то вроде этого:
df = spark.read.json(path_to_json_files)
Чтобы сохранить все атрибуты / поля, используйте схему следующим образом:
df = spark.read.schema(file_schema).json(path_to_json_files)
Чтобы получить file_schema
Вы можете использовать старые файлы, которые, как вы знаете, доступны каждому атрибуту:
file_schema = spark.read.json(full_json_file).schema