Я пытаюсь запустить некоторый код, чтобы просто просмотреть кучу файлов и записать те, которые оказались файлами .txt, в один файл, удалив все пробелы. Вот некоторый простой код, который должен добиться цели:
for subdir, dirs, files in os.walk(rootdir):
for file in files:
if '.txt' in file:
f = open(subdir+'/'+file, 'r')
line = f.readline()
while line:
line2 = line.split()
if line2:
output_file.write(" ".join(line2)+'\n')
line = f.readline()
f.close()
Но вместо этого я получаю следующую ошибку:
Файл "/usr/lib/python3.1/codecs.py", строка 300, в декодировании
(результат, использованный) = self._buffer_decode (data, self.errors, final)
UnicodeDecodeError: кодек «utf8» не может декодировать байт 0xfe в позиции 0: неожиданный байт кода
Оказывается, что все эти файлы .txt находятся в UTF-16 (по крайней мере, согласно FireFox). Я думал, что Python 3.x должен был обрабатывать любые типы символов ??
Лучший,
Джорджина