Я хочу очистить некоторые html-страницы с вложенными элементами формы с помощью lxml.Даже BeautifulSoup задыхается на этих страницах, единственный найденный мной анализатор, который может обрабатывать их до сих пор, - это MinimalSoup, который не знает, какие теги могут быть вложенными или нет.
Есть ли в lxml какие-либо анализаторы,заботиться о вложенных тегах формы?Любые другие предложения?
Если потребуется, я просто продолжу использовать MinimalSoup.