Я не нашел ничего о разборе HTML в документации XML :: LibXML :: Reader . И я попытался разобрать HTML-сайт, и это не сработало. Мой вывод, что XML :: LibXML :: Reader не работает с HTML, верно?
Если это действительно XHTML, то нет.XML гораздо более строг, чем HTML, и анализаторы XML обычно не могут анализировать HTML.
HTML :: TokeParser (или его базовый класс HTML :: PullParser ) наиболее похожи на XML :: LibXML :: Reader (но не на все подобные).
Возможно, вы захотите посмотреть на HTML-Tree похож на LibXML, который работает с HTML.Также имеется HTML :: TreeBuilder :: LibXML , который оборачивает еще более совместимый с LibXML интерфейс вокруг HTML-дерева.
Нет, но HTML :: TreeBuilder :: LibXML реализует совместимый интерфейс на HTML-пазере.