Для данного URL, как я могу определить окончательное местоположение в Интернете после HTTP-перенаправлений, не загружая последнюю страницу (например, запрос HEAD.), Используя python.Я пытаюсь написать массовый загрузчик, мой механизм загрузки должен знать местоположение страницы в Интернете, прежде чем загружать ее.
edit
Я закончил этим, надеюсь, это поможет другим людям.Я все еще открыт для других методов.
import urlparse
import httplib
def getFinalUrl(url):
"Navigates Through redirections to get final url."
parsed = urlparse.urlparse(url)
conn = httplib.HTTPConnection(parsed.netloc)
conn.request("HEAD",parsed.path)
response = conn.getresponse()
if str(response.status).startswith("3"):
new_location = [v for k,v in response.getheaders() if k == "location"][0]
return getFinalUrl(new_location)
return url