Я пытаюсь извлечь некоторые данные из различных HTML-страниц с помощью программы на Python. К сожалению, некоторые из этих страниц содержат введенные пользователем данные, которые иногда имеют «незначительные» ошибки, а именно несоответствие тегов.
Есть ли хороший способ, чтобы xml.dom в python пытался исправить ошибки или что-то в этом роде? В качестве альтернативы, есть ли лучший способ извлечь данные из HTML-страниц, которые могут содержать ошибки?