Я хотел бы извлечь информацию из "data-history-node-id" этого вида кода:
<div data-history-node-id="1001" role="article" about="/url-article" typeof="schema:Article" class="main-content">'
здесь это будет 1001
Я знаю, как выбрать идентификатор или класс, но это не ...
Спасибо
Попробуйте использовать одно из следующих выражений xpath:
/div/@data-history-node-id
или
/div/data(@data-history-node-id)
В зависимости от вашей реализации, по крайней мере одно из них должно вывести 1001.
1001