Python метод readline () вызвал UnicodeDecodeError - PullRequest
2 голосов
/ 17 июня 2020

Я пытаюсь прочитать и извлечь информацию из большого текстового файла и записать его в другой документ, и получаю эту ошибку: Error message Вот мой код:

#Create list with PLZ, city and state
cepfinal = open("cepfinal.txt", "w")    #file to be written

with open("ceptest2.txt", "r") as fp:   #read file
    while True:
        line = fp.readline()
#   print(str(line))
        x = line.split("\t")            #separate all that have double space
        plz = x[0]                      #extract PLZ
#   print(plz)

        y = x[1]
        mun = y.split("/")              #separe city from state
#   print(mun)
        plzmun = [plz] + mun
#   print(plzmun)
        final = plzmun.pop(2)           #remove state
        plzmun = " ".join(plzmun)       #create string
        print(plzmun)
        cepfinal.write(plzmun + "\n")

fp.close()

Это Файл размером 45 ГБ, так что я полагаю, что у меня проблема с памятью. Может ли кто-нибудь помочь мне в создании бережливого кода?

1 Ответ

1 голос
/ 17 июня 2020

ваша проблема с кодировкой, вы можете попробовать это, чтобы решить вашу проблему

with  open("ceptest2.txt", "r", encoding="utf8") as fp:
...