Изменение кодировки файлов * .txt в каталоге с Python - PullRequest
0 голосов
/ 15 апреля 2019

Я хотел бы изменить кодировку файлов .txt в каталоге с python на UTF-8, есть ли способы сделать это?

Спасибо за вашу поддержку.

Я видел решение, уже упомянутое пользователями stackoverflow: Как преобразовать файл в utf-8 в Python?

Я хотел бы применить его ко всем файлам определенной категории в каталоге, а не к одному файлу.

import codecs
BLOCKSIZE = 1048576 # or some other, desired size in bytes
with codecs.open(sourceFileName, "r", "your-source-encoding") as sourceFile:
    with codecs.open(targetFileName, "w", "utf-8") as targetFile:
        while True:
            contents = sourceFile.read(BLOCKSIZE)
            if not contents:
                break
            targetFile.write(contents)

1) Я хотел бы изменить кодировку файлов в каталоге на UTF-8, я знаю кодировку ввода.

2) есть ли решения для преобразования в UTF-8, не зная входную кодировку? (не важно в настоящее время, но если решение уже существует, будет полезно узнать об этом)

1 Ответ

0 голосов
/ 15 апреля 2019

Поставьте нижнюю строку над with codecs.open(sourceFileName, "r", "your-source-encoding") as sourceFile строкой кода:

for sourceFileName in os.listdir("./Your_File_path"):

Если вы хотите делать только .txt файлы и по вашему пути они также являются другими файлами ... сделайте это glob

import glob
for filename in glob.glob('*.txt'):
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...