Как читать заголовок с помощью Pycurl - PullRequest
23 голосов
/ 23 января 2009

Как прочитать заголовки ответа, возвращаемые из запроса PyCurl?

Ответы [ 4 ]

29 голосов
/ 23 января 2009

Существует несколько решений (по умолчанию они отбрасываются). Вот Пример использования опции HEADERFUNCTION, которая позволяет вам указать функция для их обработки.

Другие решения - опции WRITEHEADER (не совместимы с WRITEFUNCTION) или установите для HEADER значение True, чтобы они передавались с телом.

#!/usr/bin/python

import pycurl
import sys

class Storage:
    def __init__(self):
        self.contents = ''
        self.line = 0

    def store(self, buf):
        self.line = self.line + 1
        self.contents = "%s%i: %s" % (self.contents, self.line, buf)

    def __str__(self):
        return self.contents

retrieved_body = Storage()
retrieved_headers = Storage()
c = pycurl.Curl()
c.setopt(c.URL, 'http://www.demaziere.fr/eve/')
c.setopt(c.WRITEFUNCTION, retrieved_body.store)
c.setopt(c.HEADERFUNCTION, retrieved_headers.store)
c.perform()
c.close()
print retrieved_headers
print retrieved_body
11 голосов
/ 05 февраля 2014
import pycurl
from StringIO import StringIO

headers = StringIO()

c = pycurl.Curl()
c.setopt(c.URL, url)
c.setopt(c.HEADER, 1)
c.setopt(c.NOBODY, 1) # header only, no body
c.setopt(c.HEADERFUNCTION, headers.write)

c.perform()

print headers.getvalue()

При необходимости добавьте все остальные метки завитков, такие как FOLLOWLOCATION.

6 голосов
/ 01 сентября 2011

Anothr альтернативный, human_curl использование: pip human_curl

In [1]: import human_curl as hurl

In [2]: r = hurl.get("http://stackoverflow.com")

In [3]: r.headers
Out[3]: 
{'cache-control': 'public, max-age=45',
 'content-length': '198515',
 'content-type': 'text/html; charset=utf-8',
 'date': 'Thu, 01 Sep 2011 11:53:43 GMT',
 'expires': 'Thu, 01 Sep 2011 11:54:28 GMT',
 'last-modified': 'Thu, 01 Sep 2011 11:53:28 GMT',
 'vary': '*'}
1 голос
/ 23 января 2009

Это может или не может быть альтернативой для вас:

import urllib
headers = urllib.urlopen('http://www.pythonchallenge.com').headers.headers
...