Автоматизируйте загрузку PDF, используя python - PullRequest
0 голосов
/ 23 апреля 2020

Я хочу автоматически загружать новые PDF-файлы, когда они публикуются в коллекции онлайн-библиотек. Я попытался использовать следующий код python, но обнаружил, что он не работает с urllib 3. Кто-нибудь знает, как я могу его воспроизвести?

import urllib2

def main():
    download_file("http://mensenhandel.nl/files/pdftest2.pdf")

def download_file(download_url):
    response = urllib2.urlopen(download_url)
    file = open("document.pdf", 'wb')
    file.write(response.read())
    file.close()
    print("Completed")

if __name__ == "__main__":
    main()

1 Ответ

0 голосов
/ 23 апреля 2020

Ваше решение хорошо. Я просто сделал несколько небольших корректировок. Прежде всего, вам нужно использовать метод содержимого ответа. Ниже приведен код -

import requests

def main():
    download_file("http://mensenhandel.nl/files/pdftest2.pdf")

def download_file(download_url):
    response = requests.get(download_url, stream = True)
    with open("document.pdf", 'wb') as file:
        file.write(response.content)
        file.close()
    print("Completed")

if __name__ == "__main__":
    main()
...