два варианта: pandas hdf5 или dask.
- Вы можете просмотреть формат hdf5 с форматом = 'table'.
HDFStore поддерживает другие PyTables формат на диске, формат таблицы. Концептуально таблица очень похожа на DataFrame со строками и столбцами. Таблица может быть добавлена в том же или других сеансах. Кроме того, операции удаления и типа запроса поддерживаются. Этот формат указывается с помощью format = 'table' или format = 't' для добавления или добавления или to_hdf.
Вы можете использовать dask read_csv. он считывает данные только тогда, когда execute ()
Для чистого улучшения производительности ввода-вывода, я думаю, лучше использовать hdf с форматом сжатия.