C # библиотека похожа на HtmlUnit - PullRequest
2 голосов
/ 03 октября 2009

Мне нужно написать отдельное приложение, которое будет «просматривать» внешний ресурс. Есть ли в C # библиотека lib, которая автоматически обрабатывает файлы cookie и поддерживает JavaScript (я считаю, что через JS это не требуется)? Основная цель - сохранить сеанс и отправлять формы, чтобы я мог пройти многоэтапный процесс регистрации или «просмотреть» веб-сайт после входа в систему. Я просмотрел Html Agility Pack, но, похоже, он не содержит необходимых мне функций - отправка форм или поддержка файлов cookie.

Спасибо, Артем.

Ответы [ 5 ]

3 голосов
/ 05 октября 2009

Если вы заинтересованы в написании своей собственной версии htmlunit для C #, вам может помочь проект IKVM. http://www.ikvm.net/

1 голос
/ 03 октября 2009

Посмотрите на Data Extracting SDK , который позволяет публиковать данные через класс HtmlProcessor. Также вы можете добавить свой рабочий элемент здесь, если он пропущен в библиотеке.

1 голос
/ 03 октября 2009

HtmlAgilityPack специально для анализа HTML. Вы можете использовать класс WebRequest в .NET Framework для обработки сообщений и файлов cookie.

См. Мою запись в блоге по Соскоб в Интернете в .NET . Это не ответит на все ваши вопросы, но поможет вам в этом.

0 голосов
/ 12 января 2010

Selenium, он использует настоящие браузеры, но является кросс-браузерной платформой. Зависит от того, работает ли у вас настоящий браузер или нет, он работает, внедряя в браузер javascript через прокси-сервер. http://seleniumhq.org/support/

0 голосов
/ 12 января 2010

http://msdn.microsoft.com/en-us/library/system.windows.forms.webbrowser.aspx Попробуйте свой класс WebBrowser и работайте с DOM там

...