Automati c способ загрузки PDF-файлов с веб-сайта со встроенным средством просмотра - PullRequest
0 голосов
/ 15 апреля 2020

Я хочу использовать Python для загрузки таких PDF-файлов, как этот

http://bdh-rd.bne.es/viewer.vm?id=0000023638&page=1

Обратите внимание, что зритель показывает только одну страницу за раз, и это разделен на несколько томов (11). В идеале мне нужен автоматический c способ загрузки PDF-файлов для каждого тома отдельно.

Я нашел ссылку на необработанный pdf, проверив исходный код веб-страницы, но он показывает только первую страницу, и я не знаю, как получить доступ к документу в томах

http://bdh-rd.bne.es/pdf.raw?query=id:% 220000023638% 22 * ​​1014 *

В идеале мне нужна программа, в которой я даю URL-адрес pdf, такой как

python dl_pdf.py http://bdh-rd.bne.es/viewer.vm?id=0000023638&page=1

И затем я получаю pdf объемы. Можно ли сделать что-то подобное в этом случае? В противном случае мне придется go документ при загрузке документа вручную.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...