Может ли wget скачать изображения файла слайдов. - PullRequest
0 голосов
/ 14 декабря 2018

При использовании приведенной ниже команды wget,

$ wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains grantmlong.com \
     --no-parent \
         grantmlong.com/teaching/index.html

Я пытался загрузить весь контент со страницы курса преподавателя .По какой-то причине, хотя большая часть изображений для остальной части сайта загружается правильно, изображения для слайдов лекций reve.js не загружаются.

Например,если на моем локальном компьютере я перехожу к grantmlong.com/teaching/lectures/ и открываю lecture1.html, то для третьего слайда появляется enter image description here

Вместо этого: enter image description here

На сайте я нахожу, что изображение находится в https://grantmlong.com/teaching/lectures/img/hbr.png.Если я перейду к локальной папке img, загруженной с помощью wget, я вижу, что

cd grantmlong.com/teaching/lectures/img
ls -1
l10_f0.png
l10_f1.png
l10_f2.png
l10_f3.png
l10_f4.png
l10_f5b.png
l10_f5.png
l10_f6.png
l10_f7.png
l10_p1.png
l10_p2.png
l11_p1.png
l11_p2.png
l11_p3.png
l11_p4.png
l11_p5.png
l11_p6.png
l12_p1.png
l12_p2.png
l5_e1.png
l5_e2.png
l5_e3.png
l5_e4.png
l5_glm.png
l5_logreg.png
l5_p10.png
l5_p11.png
l5_p1a.png
l5_p1b.png
l5_p2.png
l5_p3.png
l5_p4.png
l5_p5.png
l5_p6.png
l5_p7.png
l5_p8.png
l5_p9.png
l5_reg_output_1.png
l5_reg_output_2.png
l5_reg_output_3.png
l5_reg_output_4.png
l5_reg_output.png
l6_accuracy.png
l6_confusion.png
l6_p1.png
l6_precision.png
l6_recall.png
l9_p1.png
l9_p2.png
l9_p3.png
l9_p4.png
l9_t1.png
l9_t2.png
l9_t3.png
l9_t4.png
l9_t5.png

hbr.png нигде не найти, что показывает, что изображения на этих слайдах reve.js не рассматриваются"реквизиты страницы" и не загружаются wget.

Что я могу сделать, чтобы загрузить эти изображения?Также обратите внимание, что некоторые изображения на слайдах reve.js взяты со сторонних сайтов, таких как giphy .Как я могу гарантировать, что этот внешний контент загружен, сохраняя при этом параметр --domains grantmlong.com true для всех страниц, которые не раскрываются в слайдах .js?

...