Я начинающий питон.
Я пытаюсь добавить (объединить) текст из всех 8 текстовых файлов в один текстовый файл, чтобы сделать корпус.
Однако я получаю ошибку
UnicodeDecodeError: кодек 'charmap' не может декодировать байт 0x9d в позиции 7311: символ отображается на
filenames = glob2.glob('Final_Corpus_SOAs/*.txt') # list of all .txt files in the directory
print(filenames)
Выход:
['Final_Corpus_SOAs \\ 1.txt', 'Final_Corpus_SOAs \\ 2.txt', 'Final_Corpus_SOAs \\ 2018 SOA Muir.txt', 'Final_Corpus_SOAs \\ 3.txt', 'Final_Corpus_SOAs \\ 4.txt', 'Final_СОК \\ 5.txt ',' Final_Corpus_SOAs \\ 6.txt ',' Final_Corpus_SOAs \\ 7.txt ',' Final_Corpus_SOAs \\ 8.txt ']
with open('output.txt', 'w',encoding="utf-8") as outfile:
for fname in filenames:
with open(fname) as infile:
for line in infile:
outfile.write(line)
Выход:
UnicodeDecodeError: кодек 'charmap' не может декодировать байт 0x9d в позиции 7311: символ отображается на неопределенный
Спасибо за помощь.