Получить детали с веб-страницы - PullRequest
1 голос
/ 10 декабря 2010

Мне нужно написать код C # для захвата содержимого веб-страницы.Шаги выглядят следующим образом

  1. Перейдите к логин страница
  2. У меня есть имя пользователя и пароль, предоставьте его программно и войдите
  3. Тогда выПодробнее на странице
  4. Вы должны получить там некоторую информацию, например (идентификатор продукта, Desd и т. д.)
  5. Затем нужно нажать (по коду) на Подробное представление
  6. Тогда вы можете получить цену для этого продукта оттуда.
  7. Теперь это сделано, поэтому мы можем записать строку детализации в текстовый файл, как этот ... Принтер ABC :: 225519 :: 285,00

Пожалуйста, помогите мне в этом, (Даже код VB.Net в порядке, я могу преобразовать его в C #)

Ответы [ 4 ]

1 голос
/ 13 декабря 2010

да, я скачал эту библиотеку. Хороший.

Спасибо, что поделились этим со мной. Но у меня есть проблема с этой библиотекой. Сайт, на котором я хочу получать данные, имеет "капчу" на странице входа.

Я могу ввести это значение, если это может показать изображение и ждать ввода.

Можем ли мы добиться этого из этой библиотеки, если вы хотите получить образец.

1 голос
/ 10 декабря 2010

Этого можно достичь, используя класс WebRequest для извлечения страниц и Agility Pack *1003* для извлечения элементов из источника HTML.

1 голос
/ 10 декабря 2010

Библиотека WatiN , вероятно, то, что вам нужно.По сути, он управляет веб-браузером (я полагаю, что он поддерживает IE и Firefox, хотя они, возможно, и добавили больше с момента моего последнего использования) и обеспечивает простой синтаксис для программного взаимодействия с элементами страницы в этом браузере.Все, что вам нужно, - это имена и / или идентификаторы этих элементов или какой-то уникальный способ их идентификации на странице.

0 голосов
/ 10 декабря 2010

Этого можно добиться, используя два класса в C #: HttpWebRequest (для запроса веб-страниц) и, возможно, XmlTextReader (для анализа ответа HTML / XML).

Если вы не хотите использовать XmlTextReader, я бы посоветовал изучить Регулярные выражения, поскольку они фантастически полезны для извлечения информации из больших массивов текста, где существуют шаблоны.

Как отправлять данные с помощью класса WebRequest

...