Мне нужно просмотреть дерево DOM разобранного документа HTML.
Я использую uTidyLib перед синтаксическим анализом строки с помощью lxml
a = tidy.parseString (html_code, параметры)
dom = etree.fromstring (str (a))
иногда я получаю сообщение об ошибке, кажется, что tidylib не может восстановить искаженный HTML.
как я могу проанализировать каждый HTML-файл без ошибки (парсинг только некоторых частей файлов, которые не могут быть восстановлены)?