asp.net (веб-паук) - PullRequest
       6

asp.net (веб-паук)

0 голосов
/ 01 марта 2012

Я хочу создать веб-паука, который сможет получить некоторую полезную информацию с другого веб-сайта.Как я могу получить файл с сайта и сохранить на моем сервере?Например: URL файла http://www.abc.com/attachment.php?aid=abc, как я могу позволить пользователям моего веб-сайта загрузить файл без отображения страницы http://www.abc.com/attachment.php?aid=abc ??

Ответы [ 2 ]

0 голосов
/ 01 марта 2012

Есть много способов сделать это.

Класс WebClient может использоваться для извлечения веб-ресурсов, таких как веб-страницы.

Если вы хотите сканировать сайт, вам также нужно будет проанализировать контент, чтобы перейти по ссылкам и загрузить изображения и другие ресурсы (CSS, Javascript и т. Д.) - я предлагаю использовать такой синтаксический анализатор, как HTML Agility Pack для анализа HTML, чтобы вы могли запросить его об этих ресурсах (которые вы также можете загрузить с помощью WebClient).

0 голосов
/ 01 марта 2012

Эта ссылка может быть вам полезна.http://www.thecodinghumanist.com/Content/HowToWriteAWebCrawlerInCSharp.aspx

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...