Я использую Saxon 9 для анализа неверных источников HTML. В частности, html имеет значения href, такие как:
немного текста
Я получаю ошибки:
"Ошибка, сообщаемая анализатором XML: ссылка на сущность" g_varID "должна заканчиваться на
';' Разделитель ".
Анализатор xml читает строку "& g_varID" и жалуется, что должен быть символ ";" разграничить сущность. Но, конечно, это не предназначено для HTML-сущности - это просто часть URI.
Как я могу сказать парсеру игнорировать его? Примечание. Я использую Saxon без схемы, а не Saxon-SA.