Символы Юникода, такие как \ u0016 в XML - PullRequest
12 голосов
/ 13 декабря 2011

Есть ли способ обработки символов Unicode, таких как \ u0016 в XML?Насколько я понимаю, загрузка таких символов в XMLDocument приводит к ошибке недопустимого шестнадцатеричного символа.Я пробовал с другими символами Юникода.Кажется, они работают нормально.Только управляющие символы вызывают эту ошибку.Можем ли мы удалить эти символы без фактического разбора XML?

Ответы [ 2 ]

24 голосов
/ 13 декабря 2011

Символы обозначаются с помощью обозначения, используемого в Стандарте Юникода, то есть необязательного U +, за которым следует шестнадцатеричное число, с использованием не менее 4 цифр, например U+1234 или U+10FFFD. В XML или HTML это может быть выражено как ሴ или 􏿽.

из Технический отчет Unicode .

Допустимые символы в XML:

Char :: = # x9 | #xA | #xD | [# x20- # xD7FF] | [# xE000- # xFFFD] | [# X10000- # x10FFFF]

из расширяемый язык разметки (XML) 1,0 (пятое издание)

2 голосов
/ 13 декабря 2011

Вы не можете использовать управляющие символы напрямую в XML. Если вам нужно сохранить двоичные данные в XML-файле, вы можете Base 64 кодировать их. Таким образом, вы можете хранить изображения, ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...