Вы должны думать, что текст внутри тега похож на узел.Текстовый узел извлекается с использованием тестового узла text()
.Пример.Дано:
<body>
This is an exmaple
<p>
blablabla
<\p>
<references>
refer 1
refer 2
<\references>
another example
<\body>
XPath:
"/body/text()"
Извлечет все дочерние текстовые узлы body
, например «Это пример» и «Другой пример», а:
"/body/text()[1]"
найдет только первое «Это пример».Если вы хотите использовать все текстовые узлы-потомки, вы можете использовать:
"/body//text()"
или, вы хотите, чтобы все текстовые узлы находились внутри первого p:
"/body/p[1]//text()"