Как настроить атрибут данных с помощью Scrapy - PullRequest
0 голосов
/ 07 июня 2018

Я использую библиотеку Scrapy для сканирования веб-страницы.

Но у меня проблема.Я не знаю, как настроить таргетинг на атрибут data.

У меня есть ссылка с атрибутом data и href следующим образом:

<a data-item-name="detail-page-link" href="this-is-some-link">

То, что я хочу, это значениеhref.Если бы у a был класс, я мог бы сделать это следующим образом:

response.css('.some-class::attr(href)') 

Но проблема в том, что я не знаю, как настроить атрибут data-item-name.

Любой совет?

Ответы [ 2 ]

0 голосов
/ 07 июня 2018

Используя scrapy css селектор, вы можете сделать:

response.css('a[data-item-name="detail-page-link"]::attr(href)').extract() 
0 голосов
/ 07 июня 2018

Я не уверен, если вы можете сделать это с помощью метода css, но с помощью метода xpath вы сможете сделать:

response.xpath("//a[@data-item-name]/@href")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...