Я пытаюсь прочитать RSS-канал, используя C # и Linq to XML.
Канал закодирован в utf-8 (см. http://pc03224.kr.hsnr.de/infosys/feed/), и его чтение обычно работает нормально, за исключением узла описания, поскольку он заключен в раздел CDATA.
По какой-то причине я не вижу тег CDATA в отладчике после считывания содержимого тега "description", но я предполагаю, что он должен быть где-то там, потому что только в этом разделе немецкий Umlaute (äöü) и другие специальные символы не отображаются правильно. Вместо этого они остаются в строке utf-8, закодированной как ü
.
Могу ли я как-то правильно их прочитать или хотя бы потом расшифровать?
Это пример раздела RSS, доставляющий мне неприятности:
<description><![CDATA[blabla bietet Hörern meiner Vorlesungen “IAS”, “WEB” und “SWE” an, Lizenzen für blabla [...]]]></description>
Вот мой код, который считывает и анализирует данные RSS-канала:
RssItems = (from xElem in xml.Descendants("channel").Descendants("item")
select new RssItem
{
Content = xElem.Descendants("description").FirstOrDefault().Value,
...
}).ToList();
Заранее спасибо!