Небольшая головоломка для вас.
Комментарий к элементу трекера SourceForge содержит символ U + 2014 , EM DASH, который отображается веб-интерфейсом как —
как и должно быть.
В экспорте XML, однако, он отображается как:
—
Декодирование сущностей, что приводит к следующим кодам:
U+00E2 U+20AC U+201D
Т.е. символы —
.XML должен был быть —
, десятичное представление 0x2014, так что это, вероятно, ошибка в экспортере SF.net.
Теперь я пытаюсь изменить процесс, но не могу найтиспособ получить вышеуказанный вывод из этого символа Unicode, независимо от того, какую ошибочную последовательность кодирования / декодирования я пробую.Есть идеи, что здесь произошло и как повернуть процесс вспять?