File "/usr/lib/python3.1/codecs.py", line 300, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x92 in position 805: invalid start byte
Привет, я получил это исключение. Как мне его поймать и продолжить чтение моих файлов, когда я получу это исключение.
В моей программе есть цикл, который построчно читает текстовый файл и пытается выполнить некоторую обработку. Однако некоторые файлы, с которыми я сталкиваюсь, могут не быть текстовыми файлами или иметь строки, которые не отформатированы должным образом (иностранный язык и т. Д.). Я хочу игнорировать эти строки.
Следующее не работает
for line in sys.stdin:
if line != "":
try:
matched = re.match(searchstuff, line, re.IGNORECASE)
print (matched)
except UnicodeDecodeError, UnicodeEncodeError:
continue