Прочитайте .txt файл в Python, избегая специальных символов для замены оригинальных символов внутри файла - PullRequest
1 голос
/ 30 апреля 2020

Я хочу знать, как я могу прочитать файл .txt таким образом, чтобы специальные символы не перезаписывали содержимое моего файла .txt, чтобы я мог сохранить исходное содержимое файла

Я использую следующие строки кода:

with open('D:/nap31.txt') as gh:
    line = True
    while line:
        line = gh.readline()

Пример содержимого из файла nap31.txt:

Teda Production Site Oranienburg Lehnitzstr. 70 – 98 16515 Oranienburg France packaging

Zene AB Gärtunavägen SE-151 85 Södertälje SWEDEN Testing

После открытия файла и чтения его с использованием вышеуказанного кода содержимое становится:

Teda Production Site Oranienburg Lehnitzstr. 70 – 98 16515 Oranienburg France packaging

Zene AB Gärtunavägen SE-151 85 Södertälje SWEDEN Testing

Таким образом, в моем файле вместо '-' заменяются другие специальные символы. Может кто-нибудь помочь мне решить это

1 Ответ

1 голос
/ 30 апреля 2020

Когда вы открываете файл в Python, кодировкой по умолчанию является ANSI, которая не поддерживает эти конкретные символы. Поэтому вам нужно изменить кодировку на utf-8. Для этого просто измените свой код на:

with open('D:/nap31.txt', encoding='utf-8') as gh:
    line = True
    while line:
        line = gh.readline()
...