Функция load_data
читает весь файл в память, и ясно, что у вас недостаточно памяти для этого.Таким образом, вам придется отказаться от идеи, что за фазой чтения следует фаза обработки.Вместо этого читайте ваш файл построчно и обрабатывайте строки по мере их поступления.
Это разделит ваш файл на строки так же, как data.split('\n\n')
, но по одной строке за раз:
with open("mybigfile.txt", "r") as f:
for line in f:
mydata = line.rstrip()
if mydata:
do_something_with(mydata)