Я понимаю, что подобный вопрос уже задавался ранее, и решение заключается в использовании StringEscapeUtils.unescape () . Однако согласно описанию метода:
Поддерживает только пять основных XML
сущности (GT, LT, Quot, Amp, Apos).
Не поддерживает DTD или внешние
юридические лица.
У меня есть несколько файлов XML с экранированными символами, такими как ␣
и &hyph;
. Как я могу убрать это? Они определены в предоставленной DTD. Есть ли такой метод, как StringEscapeUtils, но с поддержкой DTD?