Внутренняя организация данных HDF5 и использование NumPy - PullRequest
0 голосов
/ 09 ноября 2010

Как сказано в документации hdf5, HDF5 хранит данные с использованием NumPy

. Он построен на основе библиотеки HDF5, языка Python и пакета NumPy. Он имеет объектно-ориентированный интерфейс, который:в сочетании с расширениями C для критически важных для кода частей кода делает его быстрым, но чрезвычайно простым в использовании инструментом для интерактивного хранения и извлечения очень больших объемов данных "

...

"PyTables использует эти контейнеры NumPy в качестве буферов в памяти для продвижения полосы ввода-вывода к пределам платформы."

Так, каков механизм?Как PyTables использует NumPy? В конце концов, они генерируют простой hdf5, доступный с других языков ...

1 Ответ

1 голос
/ 09 ноября 2010

HDF5 - это библиотека языков Си. HDF5 хранит числа, включая числа с плавающей запятой, независимо от платформы. (прокрутите вниз до таблицы под названием «Примеры собственных типов данных и соответствующих типов C», , больше информации в Руководстве пользователя ).

PyTables просто преобразует тип данных HDF5 в тип данных NumPy.И он смешивает код Python и собственный код, чтобы уменьшить накладные расходы ввода-вывода.

...