c # анализ HTML с использованием XPathDocument - PullRequest
4 голосов
/ 15 октября 2010

Я пытаюсь проанализировать HTML-страницу с XPathDocument, но выдает ошибку, потому что HTML-это не XML ... Есть ли способ сделать это или нет?

Ответы [ 2 ]

7 голосов
/ 15 октября 2010

Следует использовать HtmlAgilityPack . Все еще лучший!

2 голосов
/ 15 октября 2010

Используйте что-то вроде Html Agility Pack , который может загрузить ваш html в объект DOM, который можно просмотреть, например, с помощью запросов xpath.

Если ваш html на самом деле не является xhtml, он обычно не является допустимой структурой xml с правильными открывающими и заканчивающими тегами узлов.

...