Я столкнулся с проблемой с питоном уже несколько дней.Я биоинформатик, не обладаю базовыми навыками программирования, и я работаю с огромными текстовыми файлами (около 25 ГБ), которые мне нужно обработать.
Мне нужно построчно читать txt-файл группами по 4 строкивремя, что означает, что первые 4 строки должны быть прочитаны и обработаны, а затем я должен прочитать вторую группу из 4 строк и т. д.
Очевидно, я не могу использовать оператор readlines (), потому что онперегрузит мою память, и мне придется использовать каждую из 4 строк для распознавания некоторых строк.
Я думал об использовании цикла для с оператором range :
openfile = open(path, 'r')
for elem in range(0, len(openfile), 4):
line1 = readline()
line2 = readline()
line3 = readline()
line4 = readline()
(process lines...)
К сожалению, это невозможно, поскольку файл в режиме «чтения» не может быть повторен и рассматриваться как список илисловарь.
Кто-нибудь может помочь, пожалуйста, чтобы это правильно перевернуть?
Заранее спасибо