Ответ для большинства кодировок символов: Apache StringEscapeUtils в версии commons.text. Согласен. Может использоваться для экранирования строк между тегами xml. Но как мне избежать самих xml токенов?
Допустимые символы просты: https://www.w3.org/TR/xml11/#sec -common-syn
Мой пример использования - преобразование таблицы базы данных в XML, где каждое имя столбца равно одному xml токену.
<ROW><COL1>Hello</COL1></ROW>
Работает нормально, но что, если имя столбца "/ BIC / COL1"?
<ROW></BIC/COL1>Hello<//BIC/COL1></ROW>
явно недействителен. В настоящее время у меня даже нет плана, как может выглядеть кодировка. Нужно будет использовать имя тега _x26BIC_x26COL1 или что-то подобное.
Что-нибудь, что я пропускаю?