Я пытаюсь проанализировать документ в формате XML с помощью Jsoup, в частности, что находится в теге абзаца в приведенном ниже примере кода.
...
<nitf:body.content>
<p> Content would be here. </p>
</nitf:body.content>
...
В документе несколько тегов абзаца. В результате я решил использовать синтаксис селектора, чтобы попасть внутрь тега body.content, а затем тега абзаца под ним. Я пытаюсь и не могу получить это прямо сейчас с:
// epochFileDoc is the name of the document with the code shown above.
Element tag_element = epochFileDoc.selectFirst("nitf|body.content > p");
Я пробовал несколько различных комбинаций синтаксиса селектора, включая «nitf | content.body> p» и «nitf | body> p». Ни один из тех, что я пробовал, не работал.
Как бы я использовал синтаксис селектора в Jsoup, чтобы получить тег абзаца, показанный выше?
РЕДАКТИРОВАТЬ: я понимаю, почему content.body не работает в синтаксисе селектора, так как он ищет в тегах nitf: content = "body", но я все еще не знаю, как получить этот элемент.