У меня есть таблицы панд со столбцом, содержащим списки длины переменной с тысячами строк, например,
import pandas as pd
df = pd.DataFrame({0: [[1, 2], [3, 4, 5], [7], [8, 9, 10, 11]]}, )
###Output:
df
0
0 [1, 2]
1 [3, 4, 5]
2 [7]
3 [8, 9, 10, 11]
Я могу сохранить файл на диске с помощью
with pd.HDFStore('out_file', mode='w') as store:
df.to_hdf(store, key='data1')
, но не использует следующее, потому что тип столбца object
.
with pd.HDFStore('out_file', mode='w') as store:
df.to_hdf(store, key='data1', format='table', data_columns=True)
Как я могу прочитать несколько индексов из файла вместо того, чтобы прочитать весь файл и затем удалить нежелательные строки? Если hdf5 не может обрабатывать запросы для этого типа фрейма данных, то каковы альтернативные форматы данных. Спасибо.