Я использую XQuery для извлечения контента из HTML-страниц.Структура HTML-тела имеет следующий вид:
<td>
<a href ="hw1">xyz </a>
Hello world 1
<a href="hw2">Helloworld 2</a>
Helloworld 3
</td>
Мое выражение XQuery для извлечения текста выглядит следующим образом:
//a[starts-with(@href,'hw1')]/following-sibling::text()
Это выражение дает мне:
Helloworld1 Helloworld 2 Helloworld 3
Мне бы хотелось, чтобы это было так: Helloworld 1 Helloworld 2 Helloworld 3 или Helloworld 1 Helloworld 3
Как указать, чтобы анализировать текст, заключенный в теги