Разбор текста Xquery с тегами <a> - PullRequest
0 голосов
/ 25 июня 2010

Я использую XQuery для извлечения контента из HTML-страниц.Структура HTML-тела имеет следующий вид:

 <td>
      <a href ="hw1">xyz </a>
          Hello world 1 
        <a href="hw2">Helloworld 2</a>
          Helloworld 3         
 </td>

Мое выражение XQuery для извлечения текста выглядит следующим образом:

  //a[starts-with(@href,'hw1')]/following-sibling::text()

Это выражение дает мне:

Helloworld1 Helloworld 2 Helloworld 3

Мне бы хотелось, чтобы это было так: Helloworld 1 Helloworld 2 Helloworld 3 или Helloworld 1 Helloworld 3

Как указать, чтобы анализировать текст, заключенный в теги

1 Ответ

0 голосов
/ 25 июня 2010

Я не совсем понимаю, что вы ищете, но

let $content := 
 <td>
      <a href ="hw1">xyz </a>
          Hello world 1 
        <a href="hw2">Helloworld 2</a>
          Helloworld 3         
 </td>

return $content/text()

дает вам текстовые узлы непосредственно под

.Я не вижу разницы между тем, что вы получаете, и тем, что вы хотите ... возможно, ваш пост потерял некоторое форматирование?
...