Привет, у меня есть документ, из которого я пытаюсь извлечь дату. Но проблема в узле вместе с датой - это тоже какой-то текст.
Что-то вроде
<div class="postHeader">
Posted on
July 20, 2009 9:22 PM PDT
</div>
Из этого тега я просто хочу элемент даты, а не текст сообщения.
что-то вроде
./xhtml:div[@class = 'postHeader']
получает все. и если быть точным, то документ, который у меня есть, в основном представляет собой список узлов этих элементов, например, я получу 10 узлов этих элементов с разными значениями даты, но, что еще хуже, проблема заключается в том, что когда-нибудь внутри этих тегов появляются другие случайные теги, которые также напоминают якоря и т. д. Могу ли я написать универсальный expath, который просто получит дату из тега div?