У меня есть файл XML, из которого я пытаюсь удалить спецификацию, так как мне нужно проанализировать ее с помощью l xml. Ссылку на файл можно найти здесь . Некоторый упрощенный код для этого был бы:
from lxml import etree
f = open(filename, "r")
ff = f.read()
fff = ff.encode('utf-8-sig')
ffff = fff.decode('utf-8')
tree = etree.fromstring(ffff)
Я попытался следовать некоторым из приведенных здесь примеров для работы с такого рода экземпляром, однако я все еще получаю ту же ошибку, с которой начал:
lxml.etree.XMLSyntaxError: Start tag expected, '<' not found, line 1, column 1
Что я сделал не так?
Спасибо