Попытка использовать fancyURLopener в Python3 для PDF, но это выдает ошибку DeprecationWarning - PullRequest
0 голосов
/ 19 января 2019

Я пытаюсь получить доступ к PDF-файлу с веб-сайта банка для майнинга PDF, но он возвращает ошибку HTTP 403. Поэтому в качестве обходного пути я пытаюсь изменить свой User-Agent на браузер для доступа к файлу (и его загрузки).

Код ниже является частью того, что у меня есть сейчас. Это возвращает следующую ошибку:

C: \ Users \ Имя \ Anaconda3 \ lib \ site-packages \ ipykernel_launcher.py: 8: DeprecationWarning: стиль вызова запросов MyOpener устарел. Используйте новые функции / методы urlopen

Как мне это исправить?

import urllib.request

my_url = 'someurl here'

class MyOpener(urllib.request.FancyURLopener):
    version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) 
Gecko/20071127 Firefox/2.0.0.11'

myopener = MyOpener()

page = myopener.open(my_url)
page.read()

1 Ответ

0 голосов
/ 19 января 2019

Вы можете попробовать это:

import urllib2

def download_file(download_url):
    response = urllib2.urlopen(download_url)
    f = open("the_downloaded_file.pdf", 'wb')
    f.write(response.read())
    f.close()

download_file("some url to pdf here")
...