Я анализирую XML-документ, используя SAX в Java.
Я работаю с XML, который описывает исследовательские публикации в разных областях.
Среди других есть такие элементы, как «абстрактный», которые кратко описывают содержание статьи. В этом поле разрешено базовое форматирование HTML, но я не хочу, чтобы SAX представлял угрозу для тегов HTML (таких как i, b, u, sub, sup и т. Д.) Как реальных тегов XML, так и для fire strartElement () и endElement ( ) события на этих элементах.
Есть ли способ сказать SAX игнорировать некоторый предопределенный набор тегов XML и передавать их XML-код как есть методу символов ()?