wget "зеркальное отображение" pdf, связанный с другим доменом - PullRequest
1 голос
/ 21 сентября 2011

Веб-страница содержит ссылку на pdf (обратите внимание на разные домены).

Я могу использовать wget для прямой загрузки pdf, но не могу определить правильные параметры командной строки wget для «зеркалирования» веб-страницы, включая этот связанный pdf. Я пытался использовать комбинации параметров, таких как

  • -p
  • - пролетные-хосты
  • - принять

безуспешно.

Можно ли использовать wget (или другой инструмент командной строки) для загрузки связанных pdf-файлов?

Спасибо

Ответы [ 2 ]

1 голос
/ 25 сентября 2011

Попробуйте выполнить синтаксический анализ http://www.yowconference.com.au/brisbane/data/35.js. (я нашел этот URL-адрес с помощью HttpFox.) После форматирования кода (например, с помощью http://jsbeautifier.org/) легко извлечь URL-адрес файлов PDF.

0 голосов
/ 23 сентября 2011

Хотя ссылка pdf отображается в браузерах, источник страницы не содержит ссылку для загрузки. Так что wget не может видеть / переходить по ссылке, поскольку на самом деле она не "обрабатывает" страницу.

...