Как проверить, если urllib2 следовать перенаправлению? - PullRequest
6 голосов
/ 07 декабря 2011

Я написал эту функцию:

def download_mp3(url,name):
        opener1 = urllib2.build_opener()
        page1 = opener1.open(url)
        mp3 = page1.read()
        filename = name+'.mp3'
        fout = open(filename, 'wb')
        fout.write(mp3)
        fout.close()

Эта функция принимает URL-адрес и имя в виде строки. Затем загрузите и сохраните mp3-файл с URL-адреса с именем переменной.

URL-адрес имеет вид http://site/download.php?id=xxxx, где xxxx - это идентификатор mp3

если этот идентификатор не существует, сайт перенаправляет меня на другую страницу.

Итак, вопрос: как я могу проверить, существует ли этот идентификатор? Я пытался проверить, существует ли URL с помощью функции, подобной этой:

def checkUrl(url):
    p = urlparse(url)
    conn = httplib.HTTPConnection(p.netloc)
    conn.request('HEAD', p.path)
    resp = conn.getresponse()
    return resp.status < 400

Но, похоже, он не работает ..

Спасибо

Ответы [ 2 ]

5 голосов
/ 07 декабря 2011

Как то так, и проверьте код:

import urllib2, urllib

class NoRedirectHandler(urllib2.HTTPRedirectHandler):
    def http_error_302(self, req, fp, code, msg, headers):
        infourl = urllib.addinfourl(fp, headers, req.get_full_url())
        infourl.status = code
        infourl.code = code
        return infourl
    http_error_300 = http_error_302
    http_error_301 = http_error_302
    http_error_303 = http_error_302
    http_error_307 = http_error_302

opener = urllib2.build_opener(NoRedirectHandler())
urllib2.install_opener(opener)
response = urllib2.urlopen('http://google.com')
if response.code in (300, 301, 302, 303, 307):
    print('redirect')
2 голосов
/ 21 ноября 2015

Мой ответ на это выглядел как

req = urllib2.Request(url)
try:
   response = urllib2.urlopen(url)
except urllib2.HTTPError as e:
   # Do something about it
   raise HoustonWeHaveAProblem
else:
   if response.url != url:
       print 'We have redirected!'
...