Как извлечь текст из узла, но не из его потомков - PullRequest
1 голос
/ 31 июля 2011

Я пытаюсь разобрать этот фрагмент с помощью nokogiri со страницы (так называемой var), которая содержит

...
<dd>
    <a href="http://www.bo.es">Access </a>
    - 19/07/11
</dd>
...

page.at("dd").text показывает мне весь текст, не только дд, но и текст его потомков. Я имею в виду

"Access - 19/07/11"

Как мне извлечь только "- 19/07/11"?

(это только пример)

1 Ответ

1 голос
/ 02 августа 2011

Попробуйте page.xpath("//dd/text()").text

...