XPath извлекает значение из атрибута - PullRequest
0 голосов
/ 07 ноября 2018

Это мой HTML-код:

<tr valign="top">
    <td nowrap="x">Citation(s)</td>
    <td>
        <span class="pubmed_id" id="26472973">
            <a href="/pubmed/26472973">26472973</a>
        </span>
    </td>
</tr>

Я хотел бы извлечь число 26472973, которое является значением, которое изменяется для каждой записи в базе данных.

Ответы [ 2 ]

0 голосов
/ 08 ноября 2018

Если вам нужны цитаты, попробуйте еще раз:

//tr/td[text()='Citation(s)']/following-sibling::td/span/@id
0 голосов
/ 07 ноября 2018

Неясно, хотите ли вы получить значение из атрибута @id или следующего элемента a.
Итак, для значения атрибута попробуйте этот XPath:

//tr[@valign='top']/td/span[@class='pubmed_id']/@id

Или, для значения a элемента используйте этот XPath:

//tr[@valign='top']/td/span[@class='pubmed_id']/a/text()

В обоих случаях результат равен 26472973.

...