Сколько файлов генерирует zarr? - PullRequest
0 голосов
/ 12 апреля 2019

Я ищу поточно-ориентированную альтернативу hdf5 для чтения в многопроцессорной среде и наткнулся на zarr , который, согласно тестам, по сути, является заменой h5py всреда питона.

Я попробовал это, и пока все выглядит хорошо, но я не могу обернуть голову количеством файлов, выводимых zarr.

Если я записываю в h5-файл с h5py, получается только один файл, тогда как zarr , похоже, выдает случайное количество файлов в подпапке.

Кто-нибудь объяснит мне, почему это так и от чего зависит точное количество созданных файлов?

заранее спасибо

1 Ответ

1 голос
/ 17 апреля 2019

Zarr обычно отображает ключи (определенные индексы чанка) в значения (двоичные двоичные объекты), представляющие данные этого чанка. Если вы используете DirectoryStore, это приводит к записи на диск ряда различных файлов. Количество просматриваемых файлов будет зависеть от того, сколько блоков у вас в массивах и какие содержат нетривиальное содержимое (например, ненулевые значения).

...