У меня есть несколько тяжелых * .txt тяжелых файлов (~ 200 ГБ каждый), и я пытаюсь подсчитать значения в определенном столбце ('val'). Я использовал Python Pandas для этого случая, но я счастлив использовать Unix или любой более быстрый метод.
file = pd.read_csv('example1.txt', sep = '\t')
print(file['val'].value_counts())
Тем не менее, я получил сообщение «Убито» или был использован предел памяти.
Любое предложение, чтобы сделать мою работу при использовании тяжелых файлов?