Все данные XML являются Unicode, так что я думаю, что под Unicode вы подразумеваете «символы вне репертуара ASCII».Вы делаете два противоречивых утверждения: вы подразумеваете, что не можете «извлечь» (или «проанализировать») входные данные, и вы также говорите, что они «выглядят по-разному» при выводе.Вы должны быть намного более точным.Если ваш метод parse () не работает, сообщите нам, как он не работает.Если данные «выглядят по-разному» на выходе, сообщите нам, как вы их отображали и как они выглядят.
Где-то в вашей цепочке обработки происходит недопонимание кодировки, когда какой-то компонент вашей системы получает данные в одной кодировке, которая, по его мнению, находится в другой.Решение таких проблем является сложным, и это может быть сделано только с очень точной информацией о том, как данные проходят через систему и как настроены все компоненты.