Скачать все ссылки с любой страницы - PullRequest
1 голос
/ 21 января 2010

Я хочу разработать страницу asp.net, с помощью которой я могу указать URL-адрес любой страницы, которая содержит ссылки на многие файлы и каталоги. Я хочу скачать их все. Похож на плагин DownThemAll в FireFox.

т.е.

Файл «MyPage.htm» содержит множество ссылок на файлы / каталоги, расположенные на одном сервере.

Теперь я хочу написать функцию, которая может загрузить все эти файлы, если я предоставлю

"www.mycustomdomain.com \ Mypage.htm" в качестве ввода.

Надеюсь, вопрос ясен.

Ответы [ 2 ]

1 голос
/ 21 января 2010

Получить веб-страницу как HTML. Google (c # извлечь файл из Интернета). Первая ссылка даст вам идею.

Тогда найдите ссылки с регулярными выражениями. Пример шаблона регулярных выражений для ссылок на сайте www.x.com должен выглядеть следующим образом: (http://www.x.com/.*?) (Но лучше, если вы также включите тег A в свой шаблон регулярных выражений)

И загрузите файлы, как показано в: http://www.csharp -examples.net / скачать-файлы /

1 голос
/ 21 января 2010

Надеюсь, я понимаю ваш вопрос. У вас есть файл HTM со списком ссылок, и эти ссылки являются ссылками на определенные файлы на удаленном сервере, и вы хотите загрузить все файлы.

Нет надежного способа сделать это.

Проверьте этот вопрос. Как вы анализируете HTML в vb.net Несмотря на то, что это для VB.net, это связано с тем, что вы просили. Вы можете получить массив ссылок, а затем начать загрузку файлов.

Вы можете использовать метод Computer.Network.DownloadFile , чтобы загрузить файл remot и сохранить его в своем местоположении.

Это не провальный метод, потому что, если загрузка требует аутентификации, она загрузит HTML-страницу [главным образом, страницу loin]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...