Должен ли файл-формат паркета ВСЕГДА иметь в нем сохраненную схему (с типами данных) и заголовок? - PullRequest
0 голосов
/ 04 марта 2020

При сохранении данных в формате файла Parquet - ДОЛЖНА ли схема с типами данных также сохраняться в формате файла Parquet? (или может быть пропущен)

Кроме того, нужно ли также сохранять заголовок? (или можно пропустить)

Спасибо.

1 Ответ

2 голосов
/ 04 марта 2020

Вам всегда понадобится схема для файла Parquet, так как они двоичные и без схемы не могут быть десериализованы читателем.

Не то, чтобы у Parquet действительно был верхний и нижний колонтитулы. Все метаданные (включая схему) сохраняются в конце файла. См. Следующее изображение для структуры файла паркета:

Parquet file format structure

Источник: https://parquet.apache.org/documentation/latest/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...