Я ищу библиотеку C #, которая преобразует HTML-код (и CSS-код, указанный в коде) в дерево DOM для более простого анализа. Я ищу что-то похожее на это (который находится в PHP): http://simplehtmldom.sourceforge.net/
Конечно, я знаю, что могу встроить элемент управления браузером, но я ищу что-то более эффективное.
Проверьте HTML Agility Pack . Некоторое время он не обновлялся, но все равно работает очень хорошо.
Нет способа получить DOM с такими стилями. Единственная опция - это фреймворк Selenium, который работает с реальным браузером.
Мы использовали HTMLAgility здесь в нашем проекте, чтобы извлечь определенные HTML-теги с заданным набором атрибутов, используя XPath, и это никогда не подводило нас.
Я второй мистер Дорман в пакете HtmlAgilityPack. Некоторое время назад я сделал краткое сообщение в блоге о просмотре веб-страниц ; в нем упоминается «пакет», но в основном обсуждаются другие детали. В зависимости от вашего приложения оно может быть полезным.