Python текст справки больших файлов - PullRequest
0 голосов
/ 03 ноября 2019

этот код прекрасно работает, единственная проблема, с которой он не работает с большими текстовыми файлами. 1 ГБ текстовый файл. Что я могу сделать, чтобы исправить?

import os

file_1 = open('file1.txt', 'r', encoding='utf8').read().splitlines()
file_2 = open('file2.txt', 'r', encoding='utf8').read().splitlines()
[file_2.remove(l) for l in file_1 if l in file_2]
with open('file2.txt', 'w') as new_file:
    [new_file.write(l + '\n') for l in file_2]

Ответы [ 2 ]

1 голос
/ 03 ноября 2019

Вам необходимо прочитать файлы без сохранения содержимого в памяти. Вы можете сделать это, используя with для входных файлов

with open(r'C:\Users\Guy.SA\Desktop\fileB.txt', 'r') as file_2, open(r'C:\Users\Guy.SA\Desktop\fileC.txt', 'w') as new_file:
    for line_2 in file_2:
        with open(r'C:\Users\Guy.SA\Desktop\fileA.txt', 'r') as file_1:
            for line_1 in file_1:
                if line_1 == line_2:
                    break
            else:
                new_file.write(line_2)
0 голосов
/ 03 ноября 2019

Вы должны использовать объект файла для этого:

with open('file1.txt', 'r', encoding='utf8') as file_1,
     open('file2.txt', 'r', encoding='utf8') as file_2:

    for line in file1: # or file 2
        # Do what you need to do with reading it line by line

Также обратите внимание, что:

with закроет файл автоматически после.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...