Как заставить Python urllib2 следовать редиректу и сохранять метод post - PullRequest
2 голосов
/ 11 августа 2009

Я использую urllib2 для отправки данных в форму. Проблема заключается в том, что форма отвечает перенаправлением 302. В соответствии с Python HTTPRedirectHandler обработчик перенаправления примет запрос и преобразует его из POST в GET и будет следовать 301 или 302. Я хотел бы сохранить метод POST и данные, передаваемые открывателю. Я предпринял неудачную попытку создания пользовательского HTTPRedirectHandler, просто добавив data = req.get_data () в новый запрос.

Я уверен, что это было сделано раньше, поэтому я подумал, что сделаю пост.

Примечание: это похоже на это сообщение и это , но я не хочу предотвращать перенаправление, я просто хочу сохранить данные POST.

Вот мой HTTPRedirectHandler, который не работает

class MyHTTPRedirectHandler(urllib2.HTTPRedirectHandler):
def redirect_request(self, req, fp, code, msg, headers, newurl):
    """Return a Request or None in response to a redirect.

    This is called by the http_error_30x methods when a
    redirection response is received.  If a redirection should
    take place, return a new Request to allow http_error_30x to
    perform the redirect.  Otherwise, raise HTTPError if no-one
    else should try to handle this url.  Return None if you can't
    but another Handler might.
    """
    m = req.get_method()
    if (code in (301, 302, 303, 307) and m in ("GET", "HEAD")
        or code in (301, 302, 303) and m == "POST"):
        # Strictly (according to RFC 2616), 301 or 302 in response
        # to a POST MUST NOT cause a redirection without confirmation
        # from the user (of urllib2, in this case).  In practice,
        # essentially all clients do redirect in this case, so we
        # do the same.
        # be conciliant with URIs containing a space
        newurl = newurl.replace(' ', '%20')
        return Request(newurl,
                       headers=req.headers,
                       data=req.get_data(),
                       origin_req_host=req.get_origin_req_host(),
                       unverifiable=True)
    else:
        raise HTTPError(req.get_full_url(), code, msg, headers, fp)

1 Ответ

6 голосов
/ 11 августа 2009

Это действительно очень плохая вещь, чтобы больше думать об этом. Например, если я отправлю форму http://example.com/add (с данными для добавления элемента) и ответом является перенаправление 302 на http://example.com/add, и я публикую те же данные, которые я опубликовал в первый раз, когда я попаду в бесконечный цикл. Не уверен, почему я не думал об этом раньше. Я оставлю этот вопрос здесь как предупреждение для всех, кто задумывается об этом.

...