XML :: LibXML :: Reader читает HTML? - PullRequest
       1

XML :: LibXML :: Reader читает HTML?

1 голос
/ 23 апреля 2010

Я не нашел ничего о разборе HTML в документации XML :: LibXML :: Reader . И я попытался разобрать HTML-сайт, и это не сработало. Мой вывод, что XML :: LibXML :: Reader не работает с HTML, верно?

Ответы [ 2 ]

3 голосов
/ 23 апреля 2010

Если это действительно XHTML, то нет.XML гораздо более строг, чем HTML, и анализаторы XML обычно не могут анализировать HTML.

HTML :: TokeParser (или его базовый класс HTML :: PullParser ) наиболее похожи на XML :: LibXML :: Reader (но не на все подобные).

Возможно, вы захотите посмотреть на HTML-Tree похож на LibXML, который работает с HTML.Также имеется HTML :: TreeBuilder :: LibXML , который оборачивает еще более совместимый с LibXML интерфейс вокруг HTML-дерева.

1 голос
/ 23 апреля 2010

Нет, но HTML :: TreeBuilder :: LibXML реализует совместимый интерфейс на HTML-пазере.

...