У меня есть сценарий Python, который анализирует XML-файл и возвращает следующую ошибку:
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 614617: character maps to <undefined>
Я почти уверен, что ошибка происходит из-за наличия недопустимых символовв документе XML, который я пытаюсь проанализировать, однако у меня нет доступа, чтобы напрямую исправить этот конкретный файл XML, из которого я читаю.
Могу ли я иметь его, чтобы эти символы не сработалимой сценарий и позволяет ему продолжать синтаксический анализ без ошибок?
Это часть скрипта, которая читает XML и расшифровывает его:
def ReadXML(self, path):
self.logger.info("Reading XML from %s" % path)
codec = "Windows-1252"
xmlReader = open(path, "r")
return xmlReader.read().decode(codec)