O'Neil
юридически корректно: from-xml(to-xml("O'Neil")) == "O'Neil"
.
Когда в XML было введено "O'Neil"
, оно было преобразовано в "O'Neil"
, поскольку апостроф - это специальный символ в XML.
ASCII 39 - это апостроф '
, так что это не так, как если бы ноль 0 был изменен на заглавную O. Я бы даже сказал, что форма с '
искажает исходную O'Neil
.
Если вам все еще нужно это сделать:
Поскольку возможно несколько форм для этих сущностей: ' ' '
, повторное экранирование, например StringEscapeUtils.escapeXML(...)
, также не будет выполняться.
Вам понадобитсяперехватить обработку объекта и перевести на исходный текст как есть.
Для обсуждения, аргументации.Обратите внимание, что кодировка XML, скажем, UTF-8 влияет на байты.Если они содержат акцентированную букву, такую как é
, преобразование в некоторую кодировку Windows также должно привести к читаемому символу é, а не двум странным символам (последний не преобразует эти байты для é).