При сохранении данных в формате файла Parquet - ДОЛЖНА ли схема с типами данных также сохраняться в формате файла Parquet? (или может быть пропущен)
Кроме того, нужно ли также сохранять заголовок? (или можно пропустить)
Спасибо.
Вам всегда понадобится схема для файла Parquet, так как они двоичные и без схемы не могут быть десериализованы читателем.
Не то, чтобы у Parquet действительно был верхний и нижний колонтитулы. Все метаданные (включая схему) сохраняются в конце файла. См. Следующее изображение для структуры файла паркета:
Источник: https://parquet.apache.org/documentation/latest/