Python urllib2.Request заголовок ответа не читается для Instagram - PullRequest
0 голосов
/ 29 ноября 2018

У меня есть следующий код:

def check_proxy(input_queue):
    while 1:
        prx = input_queue.get()
        try:
            proxy_handler = urllib2.ProxyHandler({'http': prx})
            opener = urllib2.build_opener(proxy_handler)
            opener.addheaders = [('User-agent', 'Mozilla/5.0')]
            urllib2.install_opener(opener)
            req = urllib2.Request("http://www.google.com")
            sock = urllib2.urlopen(req, timeout=7)
            rs = sock.read(1000)
            if '<title>Google</title>' in rs:
                print '[OK]', prx
                input_queue.task_done()

Я изменил проверку Google.com на instagram.com

и изменил название на Instagram

Но по какой-то причине это не работает.

Я проверил «print rs» на наличие Instagram.и получил этот заголовок:

        <title>
Instagram
</title>

Просто удивительно, как заставить это работать, чтобы проверить https://www.instagram.com вместо google.com

Спасибо

1 Ответ

0 голосов
/ 29 ноября 2018

Строка, соответствующая заголовку в HTML-коде Instagram, должна быть '<title>\nInstagram\n<title>.У Google нет новых строк в их HTML, а у Instagram.

...