Синтаксический анализ ответов типа содержимого, разделенного на части в python - PullRequest
1 голос
/ 15 сентября 2011

Я пытаюсь прочитать и разобрать запрос типа контента: chunked в python.Вот что я вижу, когда загружаю URL-адрес в браузере и смотрю на источник:

<!-- ---------------------------------------------------------------- http://github.com/Atmosphere ------------------------------------------------------------------------ --> 
<!-- Welcome to the Atmosphere Framework. To work with all the browsers when suspending connection, Atmosphere must output some data to makes WebKit based browser working.--> 
<!-- --------------------------------------------------------------------------------------------------------------------------------------------------------------------- --> 
<!-- EOD -->[{"__publicationName":"dip\/acc\/LHC\/Beam\/Intensity\/Beam2","value":"2.505730663333334E9"},  {"__publicationName":"dip\/acc\/LHC\/Beam\/Intensity\/Beam1","value":"1.5584484E9"},{"__publicationName":"dip\/acc\/LHC\/Beam\/Energy","value":"495"},

Я хотел бы получить и проанализировать записи json, например:

{"__publicationName":"dip\/acc\/LHC\/Beam\/Intensity\/Beam2","value":"2.505730663333334E9"}

Как я могу это сделать?

Спасибо

1 Ответ

1 голос
/ 15 сентября 2011

"chunked" не является допустимым типом контента, хотя это действительное кодировка передачи .Судя по примеру, который вы разместили, это не похоже на вашу проблему.Это похоже на заголовок, примененный к обычному ответу jsonp.Во многих случаях комментарии sgml будут игнорироваться браузером, но вам придется извлечь их вручную для собственного использования.Вот идея борьбы с этим:

>>> import json
>>> corpus = '''<!-- ---------------------------------------------------------------- http://github.com/Atmosphere ------------------------------------------------------------------------ --> 
... <!-- Welcome to the Atmosphere Framework. To work with all the browsers when suspending connection, Atmosphere must output some data to makes WebKit based browser working.--> 
... <!-- --------------------------------------------------------------------------------------------------------------------------------------------------------------------- --> 
... <!-- EOD -->[{"__publicationName":"dip\/acc\/LHC\/Beam\/Intensity\/Beam2","value":"2.505730663333334E9"},  {"__publicationName":"dip\/acc\/LHC\/Beam\/Intensity\/Beam1","value":"1.5584484E9"},{"__publicationName":"dip\/acc\/LHC\/Beam\/Energy","value":"495"}]'''
>>> junk, data = corpus.split('<!-- EOD -->', 1)
>>> parsed = json.loads(data)
>>> for item in parsed:
...     print item
... 
{u'__publicationName': u'dip/acc/LHC/Beam/Intensity/Beam2', u'value': u'2.505730663333334E9'}
{u'__publicationName': u'dip/acc/LHC/Beam/Intensity/Beam1', u'value': u'1.5584484E9'}
{u'__publicationName': u'dip/acc/LHC/Beam/Energy', u'value': u'495'}
...