Для простоты я бы выбрал построчное чтение файла и поиск токенов <logMessage>
и </logMessage>
.Обратите внимание, что вы можете создать общий синтаксический анализатор такого типа, который принимает делегатский анализатор и передает ему SAX-подобные события.(Может быть полезно, в зависимости от того, сколько в противном случае было бы переписать парсеры, теперь ваше решение на основе SAX не работает.)
РЕДАКТИРОВАТЬ: делегатский подход также полезен, если вы заинтересованы в более чемодин вид элемента.Если они имеют сложные (встроенные) XML-иерархии, вы можете даже сопоставить все символы между открывающим и закрывающим токенами в буфер, а затем передать этот буфер в real SAX-анализатор.В большинстве случаев это было бы излишним, но опять же, если у вас есть журналы, которые по существу содержат дампы XML, это может быть более подходящим, чем попытка разобрать все это самостоятельно.