Чтобы решить мою проблему, я создал 7 ячеек (по одной на каждый файл данных).В каждой ячейке я читал файл, манипулировал им, сохранял все, что мне было нужно, затем удалял все:
import pandas as pd
import gc
df = pd.read_csv('Google drive path', compression = 'gzip')
filtered_df = df.query('my query condition here')
filtered_df.to_csv('new Google drive path', compression = 'gzip')
del df
del filtered_df
gc.collect()
После всех 7 файлов, каждый размером около 500 МБ, для общего размера строки за столбцом 7 000 000100, моя оперативная память осталась менее 1 МБ.
Простое использование del
не освободило достаточно оперативной памяти.Я должен был использовать gc.collect()
после в каждой клетке.