Я хотел бы извлечь все текстовые элементы, которые отображаются напрямую как дочерний узел в корневой узел . Я взглянул на стандартные саксофонные способности java, используя DefaultHandler
; но не похоже, что он path знает.
Проблема заключается в получении first-level only
узлов, а не извлечения только текстовых узлов .
Есть ли неориентированный на DOM подход для этого? (Обратите внимание, что имена узлов заранее не известны)
[РЕДАКТИРОВАТЬ]
Пример ввода
<root>
<a>text1</a>
<b>text2</b>
<c>text3</c>
<nested>
<d>not_text4</d>
...
<nested>
...
</root>
Пример вывода
Map<String, String> map := {
{a, text1}
{b, text2}
{c, text3}
}
В настоящее время решается как обходной путь, ориентированный на DOM. Хотя существуют библиотеки, которые предлагают подмножество выражений xpath для SAX / STAX.