Как настроить таргетинг на .css по тексту, Scrapy - PullRequest
0 голосов
/ 02 ноября 2018

Я пытаюсь изучить Scrapy for Python (3), пишу сканер, который должен получать данные с шведского сайта электронной коммерции Blocket.se.

Кнопка «Следующая страница» внизу страницы является одной из многих кнопок без уникального класса или идентификатора. Единственная разница между кнопками - фактический элемент текста, теги выглядят одинаково.

Кнопка «Следующая страница» html

<a class="page_nav" itemprop="name" href="?q=macbook+air&amp;cg=0&amp;w=1&amp;st=s&amp;c=&amp;ca=11&amp;l=0&amp;md=th&amp;o=2&amp;last=1">
            Nästa sida »
        </a>

Кнопка «1-я страница» html

<a class="page_nav" itemprop="name" href="?q=macbook+air&amp;cg=0&amp;w=1&amp;st=s&amp;c=&amp;ca=11&amp;l=0&amp;md=th">
                    1
                </a>

Есть ли способ специально нацелиться на кнопку "следующая страница" для части нумерации страниц в коде Scrapy? Может быть по фактическому тексту внутри элемента?

1 Ответ

0 голосов
/ 03 ноября 2018

Попробуйте response.xpath(u'//a[contains(text(), "Nästa sida")]/@href').get()

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...