Проверка прокси в питоне - PullRequest
14 голосов
/ 19 апреля 2009

Я написал скрипт на python, который использует куки и POST / GET. Я также включил поддержку прокси в моем скрипте. Тем не менее, когда кто-то входит в мертвый прокси-сервер, сценарий завершается сбоем. Есть ли способ проверить, мертв ли ​​/ жив прокси, прежде чем запускать остальную часть моего скрипта?

Кроме того, я заметил, что некоторые прокси-серверы неправильно обрабатывают файлы cookie / заголовки POST. Есть ли способ исправить это?

Ответы [ 3 ]

16 голосов
/ 19 апреля 2009

Самое простое было просто перехватить исключение IOError из urllib:

try:
    urllib.urlopen(
        "http://example.com",
        proxies={'http':'http://example.com:8080'}
    )
except IOError:
    print "Connection error! (Check proxy)"
else:
    print "All was fine"

Кроме того, из этого сообщения в блоге - "проверка прокси-адреса статуса" (с некоторыми незначительными улучшениями):

для питона 2

import urllib2
import socket

def is_bad_proxy(pip):    
    try:
        proxy_handler = urllib2.ProxyHandler({'http': pip})
        opener = urllib2.build_opener(proxy_handler)
        opener.addheaders = [('User-agent', 'Mozilla/5.0')]
        urllib2.install_opener(opener)
        req=urllib2.Request('http://www.example.com')  # change the URL to test here
        sock=urllib2.urlopen(req)
    except urllib2.HTTPError, e:
        print 'Error code: ', e.code
        return e.code
    except Exception, detail:
        print "ERROR:", detail
        return True
    return False

def main():
    socket.setdefaulttimeout(120)

    # two sample proxy IPs
    proxyList = ['125.76.226.9:80', '213.55.87.162:6588']

    for currentProxy in proxyList:
        if is_bad_proxy(currentProxy):
            print "Bad Proxy %s" % (currentProxy)
        else:
            print "%s is working" % (currentProxy)

if __name__ == '__main__':
    main()

для питона 3

import urllib.request
import socket
import urllib.error

def is_bad_proxy(pip):    
    try:
        proxy_handler = urllib.request.ProxyHandler({'http': pip})
        opener = urllib.request.build_opener(proxy_handler)
        opener.addheaders = [('User-agent', 'Mozilla/5.0')]
        urllib.request.install_opener(opener)
        req=urllib.request.Request('http://www.example.com')  # change the URL to test here
        sock=urllib.request.urlopen(req)
    except urllib.error.HTTPError as e:
        print('Error code: ', e.code)
        return e.code
    except Exception as detail:
        print("ERROR:", detail)
        return True
    return False

def main():
    socket.setdefaulttimeout(120)

    # two sample proxy IPs
    proxyList = ['125.76.226.9:80', '25.176.126.9:80']

    for currentProxy in proxyList:
        if is_bad_proxy(currentProxy):
            print("Bad Proxy %s" % (currentProxy))
        else:
            print("%s is working" % (currentProxy))

if __name__ == '__main__':
    main() 

Помните, что это может удвоить время, затрачиваемое сценарием, если прокси-сервер не работает (так как вам придется ждать двух тайм-аутов соединения). Если вам не нужно специально знать, что прокси-сервер виноват, обработка IOError - это далеко чище, проще и быстрее ..

1 голос
/ 21 августа 2011

Я думаю, что лучший подход, как сказал dbr, обрабатывает исключение.

Другим решением, которое может быть лучше в некоторых случаях, является использование внешнего онлайн-инструмента проверки прокси , чтобы проверить, работает ли прокси-сервер, а затем продолжить использование сценария без каких-либо модификация.

0 голосов
/ 06 июня 2013

Есть один хороший пакет Grab Так что, если это нормально для вас, вы можете написать что-то вроде этого (простой действующий прокси-генератор проверки):

from grab import Grab, GrabError

def get_valid_proxy(proxy_list): #format of items e.g. '128.2.198.188:3124'
    g = Grab()
    for proxy in proxy_list:
        g.setup(proxy=proxy, proxy_type='http', connect_timeout=5, timeout=5)
        try:
            g.go('google.com')
        except GrabError:
            #logging.info("Test error")
            pass
        else:
            yield proxy
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...