HTTPError 999: «Нет взлома» - PullRequest
       7

HTTPError 999: «Нет взлома»

0 голосов
/ 29 сентября 2018

У меня есть проблема: я пытаюсь создать скрипт на Python для загрузки веб-сайта и поиска информации.

это код:

import urllib.request

url_archive_of_nethys = "http://www.aonprd.com/Default.aspx"


def getMainPage():
    fp = urllib.request.urlopen(url_archive_of_nethys)
    mybytes = fp.read()
    mystr = mybytes.decode("utf8")
    fp.close()
    print(mystr)



def main():
    getMainPage()


if __name__ == "__main__":
    main()

но когда я его запускаю, я получаю:

 <HTTPError 999: 'No Hacking'>

Я также пытался использовать команду curl:

curl http://www.aonprd.com/Default.aspx

и я загрузил страницу правильно

Я занимаюсь разработкой с использованием Visual Studio и python 3.6

Любое предложение будет оценено, спасибо

1 Ответ

0 голосов
/ 29 сентября 2018

они, вероятно, обнаружат ваш пользовательский агент и отфильтруют вас.попробуйте изменить это:

req = urllib.request.Request(
        url, 
        data=None, 
        headers={'User-Agent': ("Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) "
                                "AppleWebKit/537.36 (KHTML, like Gecko) " 
                                "Chrome/35.0.1916.47 Safari/537.36")})
fp = urllib.request.urlopen(req)
...