Question

Я ищу поточно-ориентированную альтернативу hdf5 для чтения в многопроцессорной среде и наткнулся на zarr , который, согласно тестам, по сути, является заменой h5py всреда питона.

Я попробовал это, и пока все выглядит хорошо, но я не могу обернуть голову количеством файлов, выводимых zarr.

Если я записываю в h5-файл с h5py, получается только один файл, тогда как zarr , похоже, выдает случайное количество файлов в подпапке.

Кто-нибудь объяснит мне, почему это так и от чего зависит точное количество созданных файлов?

заранее спасибо

jakirkham · Answer 1 · 17 апреля 2019

Zarr обычно отображает ключи (определенные индексы чанка) в значения (двоичные двоичные объекты), представляющие данные этого чанка. Если вы используете DirectoryStore, это приводит к записи на диск ряда различных файлов. Количество просматриваемых файлов будет зависеть от того, сколько блоков у вас в массивах и какие содержат нетривиальное содержимое (например, ненулевые значения).

Сколько файлов генерирует zarr?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Сколько файлов генерирует zarr?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы