DataFrame Pandas в смешанном режиме не может сериализоваться в hdf5? - PullRequest
3 голосов
/ 10 марта 2012

В Pandas кажется, что я не могу хранить данные смешанного типа:

store = HDFStore('play.h5')
df = DataFrame([{'a': 1, 'b': 'hello'}, {'a': 5, 'b': 'world'}])
store.put('df', df, table=True, compression='zlib')

Это дает Exception: Cannot currently store mixed-type DataFrame objects in Table format

Это из-за некоторыхнеотъемлемое ограничение панд или просто будущее, которое нужно иметь?Кажется, что HDFStore было бы не очень полезно с этим ограничением, так как многие кадры данных будут смешанного типа.

1 Ответ

3 голосов
/ 10 марта 2012

Формат таблицы хранит все данные в виде записи, то есть все значения хранятся в одном столбце. Есть альтернативный формат таблицы, который можно использовать (один столбец на столбец DataFrame), но я еще не реализовал это. В основном формат таблицы предназначен для поддержки запросов

DataFrame смешанного типа можно сохранить, если вы сделаете table = False. Хотелось бы больше работать над этими функциями.

...