перенаправление wget js - PullRequest
       7

перенаправление wget js

6 голосов
/ 12 июня 2011

Когда я использовал wget, я пришел на страницу с перенаправлениями JS.Примерно так:

<script language="JavaScript1.2">
var s = "i_08/0101/index.php3";
location.href=""+s;
</script>

Может ли wget следовать этому перенаправлению или есть какой-то другой способ решить эту проблему.

Ответы [ 2 ]

4 голосов
/ 12 июня 2011

Вы можете проверить инструмент DHTMLGET , созданный для FAE . Цель этого проекта - предоставить базовые встроенные js и события onload поверх модифицированного wget:

Утилита dhtmlget предназначена для создания локальных копий сайтов, похожих на утилиту WGET в unix. Он поддерживает протоколы http, https, а также поиск через прокси-серверы http. Основным отличием DHTMLGET и WGET является загрузка dhtmlget ExecuteS и встроенный javascript. Он был разработан для использования в Оценщике функциональных возможностей штата Иллинойс для анализа веб-сайтов, использующих javascrpt для создания контента для функций доступности.

Простой поиск в Google может привести вас к интересной странице о запросе функции wget js .

1 голос
/ 12 июня 2011

Нет.

wget используется для загрузки удаленного местоположения как есть и не действует как веб-браузер, который анализирует содержащийся JavaScript.

Обратите внимание, что wget выполняет после перенаправления заголовка (например, 301).

Я попытался использовать lynx -source, но, к сожалению, это приведет к непроанализированной веб-страницетакже. альтернативное решение этой проблемы - написать скрипт, который загружает страницу, затем анализирует ее и автоматически загружает возможные ссылки, но я оставлю это на ваше усмотрение.

...