Получить содержимое сайта с URL - PullRequest
0 голосов
/ 23 июня 2011

У меня есть веб-сайт, который развернут на сервере, где моя организация имеет URL-адрес

http://mysubsite.mysite.com/Folder1/Folder2/Default.aspx

. В любом случае, я могу прочитать все страницы в папке.Как содержимое папки 1 или содержимое папки 2?

Ответы [ 2 ]

0 голосов
/ 28 июня 2011

Нет, вы не можете.

Конечно, вы можете использовать wget в соответствии с рекомендациями других, но это не поможет вам.Он будет только читать ссылки и собирать файлы, которые он может найти.

Короче говоря, клиент не знает, какие файлы находятся на сервере, и не все серверы сообщат об этом.

0 голосов
/ 28 июня 2011

Это можно сделать с помощью wget (http://www.gnu.org/software/wget/).

Например: wget -nc - page-реквизиты --domains mysubsite.mysite.com --no-parent mysubsite.mysite.com/Folder1/Folder2 / mysubsite.mysite.com/Folder1/Folder2/

-nc не имеет значения clobber, то есть любые существующие файлы не будут перезаписаны - page-реквизиты будут получать все необходимое для правильного просмотра страницы (файлы css,и т.д.) --domains mysubsite.mysite.com не будет переходить по ссылкам вне mysubsite.mysite.com --no-parent: не переходить по ссылкам вне каталога / Folder1 / Folder2 /

Редактировать: простоперечитайте свой вопрос - я не думаю, что вы захотите использовать рекурсивный флаг. Используйте --no-parent, и это позволит вам получить все в каталоге / Folder1 / Folder2 /.

НТН

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...