Вы хотите извлечь все теги <p>
внутри div с идентификатором bodyContent
?
//html/body//div[@id='bodyContent']//p
или просто все <p>
теги?
//p
Например, jaxen - хорошая библиотека для xpath.Вы можете использовать, например,
List<Node> nodes = new DOMXPath("//p").selectNodes(document);
for (Node node : nodes) {
// do something with the matched nodes
node.getValue();
}