Я использую Saxon & XSLT для преобразования документов HTML, над которыми у меня нет контроля.
Эти документы могут содержать символы, которые действительно должны быть закодированы, например,
™
вместо закодированного
™
В нынешнем виде Саксон выдает следующее исключение во время преобразования из HTMLEmitter :
else if (c >= 127 && c < 160) {
// these control characters are illegal in HTML
DynamicError err = new DynamicError(
"Illegal HTML character: decimal " + (int) c);
err.setErrorCode("SERE0014");
throw err;
В любом случае, нужно ли быть более снисходительным, и сказать Саксону, чтобы он игнорировал и пропускал эти символы такими, какие они есть, или - как мне настроить Саксона на использование XMLEmitter, а не HTMLEmitter?