Откройте серию URL-адресов из PDF-файла, загрузите EPUB или PDF-файл каждого из них, используя Python - PullRequest
0 голосов
/ 27 апреля 2020

У меня есть PDF-файл (см. pdf header ), содержащий список URL-адресов, каждый из которых ведет на веб-сайт, который позволяет зрителю загрузить определенную книгу Springer. Часто есть два варианта, epub и pdf, хотя иногда может быть только один вариант.

Вот типичный URL:

https://link.springer.com/book/10.1007%2F978-0-387-21736-9

Я хотел бы написать программу Python, которая перебирает список URL-адресов. в PDF и для каждого: 1) открывает URL-адрес 2) загружает файл epub, если он доступен для USB-устройства 3) в противном случае загружает PDF-файл на USB-устройство.

Может кто-нибудь указать мне правильное направление? Я не уверен, как начать. Я искал форумы, но не нашел хорошего лидера.

Спасибо!

...