Проблема с декодированием записи фидпарсера - PullRequest
0 голосов
/ 11 июня 2011

У меня есть следующий atom doc , который я пытаюсь разобрать.Однако, когда я делаю следующее:

parsed = feedparser.parse(doc)
entries = [a[content][0]['value'].encode('utf-8') for a in parsed]
j = [json.loads(e) for e in entries]

Я получаю UnicodeDecodeError для второй записи:
'utf-8', '\x9d\xa9\x9e\x00\xc8\x9d\xb2\xe9\xa6z\xb3b\x82\x1bl\x0e\xb7\x9a\x9a\x96\xabz{_j[\x1e', 0, 1, 'ordinal not in range(128)'

Я пытаюсь выяснить, где происходит эта ошибка;со мной или с фидпарсером.

1 Ответ

0 голосов
/ 12 июня 2011

Команда feedparser ответила на ваш вопрос. Пожалуйста, укажите на SO, если вы публикуете свои проблемы в другом месте. Это сэкономило бы мне время.

...