Всякий раз, когда я пытаюсь проанализировать XML с помощью специальных символов, таких как ō или 満 月 先生, я получаю сообщение об ошибке. В XML-документах утверждается, что используется кодировка UTF-8, но, похоже, это не так.
Вот как выглядит проблемный текст, когда я просматриваю XML в Firefox:
Отбеливатель: алмазная пыль
Восстание - M & Aring; Хитоцу нет
Hy & Aring; rinmaru; Отбеливатель
DiamondDust Восстание - Мо Хитоцу нет
Hyourinmaru
На реальном веб-сайте & Aring; actually - это символ ō.
Однажды,
Дораемон и его друзья встречаются
Профессор мангетсу
(& Aelig; & ordm; & aelig; & Aring; & ccedil ;,
Профессор Мангетсу?), Кто учится
магия и магические существа, такие как
гоблины и его дочь Мийоко
(& Ccedil; & frac34; & Aring; & трансф; & Aring; & застенчивая ;,
Мийоко?), И предупреждены о
опасное приближение
"Звезда
Другой мир & Quot; к
Земная орбита.
И снова на реальном сайте эти символы отображаются как 満 as 先生 и 美 夜 子.
Фактический файл XML отформатирован правильно, за исключением тех специальных символов, которые, по-видимому, не используют кодировку UTF-8. Есть ли способ заставить NSXML анализировать эти XML-файлы?