Вы можете получить первый предмет «Слово 1» с помощью
normalize-space(substring-before(substring-after(translate(span/text(),'
',''),'
'),'
'))
и получите второй предмет "Приговор 1" с
normalize-space(substring-after(substring-after (translate(span/text(),'
',''),'
'),'
'))
Вы можете удалить normalize-space(...)
, если вам это не нужно.
Узел контекста должен быть родительским для span
, в противном случае вы должны добавить к выражению //
. Ваша основная проблема заключалась в том, что перед первым элементом был перевод строки (\n
).
EDIT:
Я добавил решение для обработки CR
char для Windows 'CRLF
. Он просто удаляет символ CR
и действует на символ LF
.