взять все узлы одного типа при разборе - PullRequest
1 голос
/ 19 февраля 2011

Я создаю парсер и использую выражение //html/body//div[@id='bodyContent']/s[1], чтобы взять первый узел с тегом <p>.

Но если мне нужно взять все узлы, какое выражение я должен написать?

Спасибо

1 Ответ

2 голосов
/ 19 февраля 2011

Вы хотите извлечь все теги <p> внутри div с идентификатором bodyContent?

//html/body//div[@id='bodyContent']//p

или просто все <p> теги?

//p

Например, jaxen - хорошая библиотека для xpath.Вы можете использовать, например,

List<Node> nodes = new DOMXPath("//p").selectNodes(document);
for (Node node : nodes) {
    // do something with the matched nodes
    node.getValue();
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...