Библиотека HTML в DOM - PullRequest
       13

Библиотека HTML в DOM

0 голосов
/ 25 августа 2009

Я ищу библиотеку C #, которая преобразует HTML-код (и CSS-код, указанный в коде) в дерево DOM для более простого анализа. Я ищу что-то похожее на это (который находится в PHP): http://simplehtmldom.sourceforge.net/

Конечно, я знаю, что могу встроить элемент управления браузером, но я ищу что-то более эффективное.

Ответы [ 4 ]

3 голосов
/ 25 августа 2009

Проверьте HTML Agility Pack . Некоторое время он не обновлялся, но все равно работает очень хорошо.

0 голосов
/ 09 июня 2012

Нет способа получить DOM с такими стилями. Единственная опция - это фреймворк Selenium, который работает с реальным браузером.

0 голосов
/ 25 августа 2009

Мы использовали HTMLAgility здесь в нашем проекте, чтобы извлечь определенные HTML-теги с заданным набором атрибутов, используя XPath, и это никогда не подводило нас.

0 голосов
/ 25 августа 2009

Я второй мистер Дорман в пакете HtmlAgilityPack. Некоторое время назад я сделал краткое сообщение в блоге о просмотре веб-страниц ; в нем упоминается «пакет», но в основном обсуждаются другие детали. В зависимости от вашего приложения оно может быть полезным.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...