Как построить базу данных файлов HDF5 - PullRequest
1 голос
/ 24 марта 2019

Я изучал возможности хранения данных HDF5 и обнаружил, что он полезен для хранения больших результатов.У меня есть куча файлов hdf5 на моей локальной машине, с другой иерархической структурой.Теперь моя цель - создать базу данных / подобную структуру этих файлов, чтобы я мог выполнять базовые запросы к ней.Например, скажем, мне нужно найти набор данных с именем «ds», тогда мои результаты поиска должны включать все наборы данных из файлов HDF5 с заданным именем строки.

Я буду использовать python 3.5 для построения такой системы.Немного онлайн-поиска привел меня к трем доступным API, которые доступны в python для HDF5;h5py, панды и питалы.Я использовал панды и нашел, что это здорово, поэтому я склоняюсь в этом направлении.Также есть замечательный проект http://www.hdfql.com/;, но мне нужно больше в этом разобраться.

Другое направление - импортировать данные в реляционную базу данных, чтобы я мог выполнять sql, но это, похоже, разрушаетточка хранения данных в формате hdf5.

Итак, мне нужна помощь / указатели по этому вопросу.

...