В XML \u09A8
это , а не ссылка на символ Unicode в XML!
Есть только несколько мест, в которых \u
рассматривается как начало экранирования Unicode, и онив основном в области Java.
В XML экранированный шестнадцатеричный Unicode будет ন
, а десятичный - ন
.
Другими словами: вы получаете символы \
, u
, 0
, 9
, B
, E
назад, потому что это то, что XML содержит .
best Решение состоит в том, чтобы исправить все, что создает этого XML, чтобы использовать фактические числовые ссылки на сущности.Кроме того, вы можете вручную заменить экранированные символы \u
на соответствующие им символы, но тогда только ваш код будет правильно интерпретировать этот нестандартный XML.