Извлечь весь элемент-брат после элемента, содержащего определенный текст - PullRequest
0 голосов
/ 06 ноября 2018
<a href="/geo/query/acc.cgi?acc=GPL17021" onmouseout="onLinkOut('HelpMessage' , geo_empty_help)" onmouseover="onLinkOver('HelpMessage' , geoaxema_recenter)">GPL17021</a></td>
    <td valign="top">Illumina HiSeq 2500 (Mus musculus)</td>

Я хотел бы извлечь "Illumina HiSeq 2500 (Mus Musculus)". Я использовал этот код XPath:

//a[contains(., "GPL")]/following-sibling::td[1]/text()

Текст следует за номером, который всегда содержит «GPL». Я могу выбрать «GPL17021», но при поиске первого тд после него ничего не появляется.

1 Ответ

0 голосов
/ 06 ноября 2018

Ваш пример HTML не завершен, но кажется, что ссылка на самом деле является потомком td, поэтому следующий td не является родным братом .

Попробуйте выбрать нужный узел ниже:

//td[contains(a, "GPL")]/following-sibling::td[1]/text()
...