Открытие папок на HTML-странице с помощью perl и www :: mechanize - PullRequest
0 голосов
/ 24 мая 2011

Я пытаюсь загрузить все файлы с веб-страницы, используя perl. Проблема в том, что загружаемые файлы «скрыты» за папками, которые открываются при нажатии на маленький символ «плюс». Я могу просмотреть один за другим и открыть каждый файл, загрузить содержимое, вернуться назад, открыть следующий файл и т. Д. Мне интересно, есть ли элегантный способ сделать это, используя WWW::Mechanize или LWP::UserAgent, где я просто открываю каждая папка одним махом, а затем собрать все ссылки для скачивания?

HTML-код, который я вставил, выглядит следующим образом:

<td width='0' nowrap><a href="...link" onmouseover="window.status='Close the folder Homework #2.'; return true;" ONMOUSEOUT="window.status='';return true;">

Если я нажму на эту ссылку во время просмотра источника, откроется новая страница, показывающая все папки с указанной папкой. Теперь я могу просмотреть исходный код, вытащить файл с помощью mirror(), ОК, отлично.

НО должен быть более элегантный способ, чем делать это для каждого, верно? и просто открыть их все?

Похожий вопрос, который я могу предвидеть, заключается в том, как узнать из тегов HTML, что это кнопка, которую нужно нажать, чтобы открыть папку? (несколько уместно, особенно если выясняется, что мне нужно пройтись по каждой проверке, учитывая, что на странице есть другие ссылки)

Приношу свои извинения заранее, так как я все еще изучаю Perl и у меня 0 опыта HTML. Дайте мне знать, если вам всем нужно больше HTML или скриншотов, чтобы прояснить мой вопрос.

Спасибо всем, кто нашел время, чтобы посмотреть!

...