Как убрать нестандартные символы в XML в Java? - PullRequest
2 голосов
/ 16 мая 2011

Я понимаю, что подобный вопрос уже задавался ранее, и решение заключается в использовании StringEscapeUtils.unescape () . Однако согласно описанию метода:

Поддерживает только пять основных XML сущности (GT, LT, Quot, Amp, Apos). Не поддерживает DTD или внешние юридические лица.

У меня есть несколько файлов XML с экранированными символами, такими как ␣ и &hyph;. Как я могу убрать это? Они определены в предоставленной DTD. Есть ли такой метод, как StringEscapeUtils, но с поддержкой DTD?

1 Ответ

0 голосов
/ 16 мая 2011

Хм, это было давно, но я думаю, что реализация EntityResolver2 (Java SDK) обрабатывает внешне определенные объекты.Это часть спецификации SAX2.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...