У меня есть следующий код для открытия и чтения URL:
html_data = urllib2.urlopen(req).read()
, и я считаю, что это самый стандартный способ чтения данных из HTTP.Однако, когда ответ имеет chunked transfer-кодирование , ответ начинается со следующих символов:
1eb0\r\n2625\r\n
<?xml version="1.0" encoding="UTF-8"?>
...
Это происходит из-за упомянутого выше chunked кодирования, и, таким образом, мои данные XML становятся поврежденными.
Так вот, мне интересно, как я могу избавиться от всех метаданных, связанных с кусочной кодировкой?