Твиттер RSS-канал двойных экранирующих специальных символов ??И как мне справиться с этим с помощью универсального анализатора каналов? - PullRequest
1 голос
/ 17 июня 2011

Я анализирую набор каналов, используя Универсальный анализатор каналов

Похоже, когда твиттер генерирует канал RSS, он дважды экранирует определенные специальные символы в <description />поле.Например, скажем, я чирикаю:

Я не могу разобрать это!

Что на самом деле

I can&apos;t parse this!

в сущностях HTML.

Когда вы смотрите на голый XML из канала Twitter или RSS-канала Atom, он отображается следующим образом:

I can&amp;apos;t parse this!

У универсального анализатора каналов возникает ряд серьезных проблем с этим.Когда вы анализируете одну из записей и смотрите, как она это анализирует, вы получаете:

 I can&amp;apost parse this!

, который отображается на экране как

Я могу & apost разобрать это!

Есть идеи, как мне заставить это себя вести?Когда я открываю канал в Firefox, объекты обрабатываются правильно, поэтому ясно, что можно правильно проанализировать строку.

Я почти уверен, что поведение универсального анализатора каналов неверно, но у меняТрудно найти, какую часть кода нужно исправить.

Я также озадачен, потому что прямо на сайте написано: «3000 модульных тестов».

Конечно, один из этих тестов выглядитна фиде, который содержит сущности?

...