Я бы хотел скачать несколько бесплатных pdf-файлов (копий старой газеты) с этого веб-сайта Австрийской национальной библиотеки, используя wget
, используя скрипт bash
ниже:
for year in {14..57}; do
for month in `seq -w 1 12`; do # -w for leading zero
for day in `seq -w 1 31`; do
wget -A pdf -nc -E -nd --no-check-certificate --content-disposition http://anno.onb.ac.at/pdfs/ONB_lzg_18$year$month$day.pdf
done
done
done
Несмотря на то, что некоторые газетные выпуски недоступны, я не могу загрузить какие-либо выпуски, даже если они существуют. Я получил бы ошибки, такие как ошибка для существующего выпуска от 30 июня 1814 года, например:
http://anno.onb.ac.at/pdfs/ONB_lzg_18140630.pdf
Aufl"osen des Hostnamens anno.onb.ac.at (anno.onb.ac.at)... 193.170.112.230
Verbindungsaufbau zu anno.onb.ac.at (anno.onb.ac.at)|193.170.112.230|:80 ... verbunden.
HTTP-Anforderung gesendet, auf Antwort wird gewartet ... 404 Not Found
FEHLER 404: Not Found.
Однако, если вам нужно было загрузить соответствующие pdf-файлы вручную ( здесь , см. Правый верхний угол), вы должны нажать «ок» во всплывающем подтверждении. После того, как вы это сделали, я даже могу без проблем загрузить проблему через wget
.
Как я могу сказать wget для подтверждения через командную строку подтверждения (вопрос, который вы получите, когда захотите скачать pdf), см. Скриншот ниже? Для этого есть команда в wget?