Я знаю, что это, вероятно, просто и, возможно, спрашивалось раньше, но у меня проблемы с поиском решения.
Я анализирую некоторые RSS-каналы, которые включают HTML как блоки CDATA. Один пример здесь: http://g.msn.com/1ewenus50/news2
Лента сильно меняется, но в ней почти всегда присутствуют расширенные символы. Например, если я создаю простое консольное приложение и использую WebClient.DownloadString и смотрю на результат, я вижу такие вещи, как
"узнал о предполагаемой попытке экстремистских связей бомбардировщика Рейса 253, когда он был в полете в Рождество. Отчеты Саванны Гатри из NBC. (Сегодняшнее шоу)"
Однако эти странные символы должны быть апострофами, кавычками, тире и т. Д.
Что за хитрость заставляет их правильно декодироваться?
Если неясно, для этого я использую C # / .NET. В конце концов, этот контент будет отображаться в Silverlight, но я вижу проблему и в полной версии .NET 3.5.