/div/text()
Из приведенного примера этот XPath предоставит вам все текстовые узлы под элементом div, в данном случае test2.
Если бы вы могли более подробно остановиться на этом вопросе, мы могли бы лучше помочь вам. Div содержит 3 дочерних элемента: элемент span, текстовый узел и элемент b. Каждый из span и b имеет дочерний текстовый узел. Используя XPath, вы можете выбирать только элементы (/ div / *), только текстовые узлы (/ div / text ()) или все типы узлов (/ div / node ()).
EDIT: / text () вернет вам только текстовые узлы корневого уровня. В этом случае я ожидаю, что он вернет список узлов, содержащий 3 текстовых узла:
\t\t\t\t\t \r\n\t\t
this is the text I want
\t\t\t\t\t\t\t\t\t\t\t\t\r\n\t\t\t
Возможно, вы выбираете только первый узел в списке результирующих узлов?
Есть несколько проблем правильной формы, например, <br>
должно быть <br/>
.