Разница между файлом HDF5 и файлом PyTables - PullRequest
13 голосов
/ 04 ноября 2011

Есть ли разница между HDF5 файлами и файлами, созданными PyTables?

PyTables имеет две функции .isHDFfile() и .isPyTablesFile(), предполагая, что между этими двумя форматами есть разница.

Я немного осмотрел Google и обнаружил, что PyTableпостроен на основе HDF, но я не смог найти что-то большее.

Я особенно заинтересован в совместимости, скорости и накладных расходах.

Спасибо.

1 Ответ

17 голосов
/ 04 ноября 2011

Файлы PyTables являются файлами HDF5.

Однако, насколько я понимаю, PyTables добавляет некоторые дополнительные метаданные к атрибутам каждой записи в файле HDF.

Если вы ищете более «ванильное» решение hdf5 для python / numpy, посмотрите h5py.

Он менее похож на базу данных (то есть менее "похож на таблицу"), чем PyTables, и не имеет такого количества изящных функций запросов, но, на мой взгляд, гораздо более прост. Если вы собираетесь получать доступ к файлу hdf5 на нескольких языках, возможно, лучше выбрать h5py.

...