Как разобрать XML со специальными символами? - PullRequest
4 голосов
/ 05 июня 2010

Всякий раз, когда я пытаюсь проанализировать XML с помощью специальных символов, таких как ō или 満 月 先生, я получаю сообщение об ошибке. В XML-документах утверждается, что используется кодировка UTF-8, но, похоже, это не так. Вот как выглядит проблемный текст, когда я просматриваю XML в Firefox:

Отбеливатель: алмазная пыль Восстание - M & Aring; Хитоцу нет Hy & Aring; rinmaru; Отбеливатель DiamondDust Восстание - Мо Хитоцу нет Hyourinmaru

На реальном веб-сайте & Aring; actually - это символ ō.


Однажды, Дораемон и его друзья встречаются Профессор мангетсу (& Aelig; & ordm; & aelig; & Aring; & ccedil ;, Профессор Мангетсу?), Кто учится магия и магические существа, такие как гоблины и его дочь Мийоко (& Ccedil; & frac34; & Aring; & трансф; & Aring; & застенчивая ;, Мийоко?), И предупреждены о опасное приближение "Звезда Другой мир & Quot; к Земная орбита.

И снова на реальном сайте эти символы отображаются как 満 as 先生 и 美 夜 子.

Фактический файл XML отформатирован правильно, за исключением тех специальных символов, которые, по-видимому, не используют кодировку UTF-8. Есть ли способ заставить NSXML анализировать эти XML-файлы?

1 Ответ

3 голосов
/ 05 июня 2010

Чтобы использовать другие символы, кроме тех, которые имеют utf-8, вам нужно использовать их специальный код символа.Если вы хотите представить ö, вам нужно набрать ö

Подробнее о
Википедия: http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references

...