Как очистить промежуток с определенным названием в scrapy? - PullRequest
0 голосов
/ 19 сентября 2018

Я пытаюсь использовать Scrapy с помощью пути CSS, чтобы получить текст в полях из нескольких элементов span .CSS выглядит следующим образом:

<div class="announcement">
    <span title="Name">Homer Simpson</span>
    <span title="Date">2018-09-19</span>
    <span title="Type">House</span>
</div>

Я пробовал с этим:

response.css("div.announcement span::attr(title)").extract()
# ['Name', 'Date', 'Type']

response.css("div.announcement span::text").extract()
# ['Homer Simpson', '2018-09-19', 'House']

Но это приводит только к повторному списку span названий, илиЯ получаю все из них, но я просто хочу один за один раз.Я хотел бы получить что-то вроде:

response.css("div.announcement <SomeMagicHere>('Name')").extract()
# ['Homer Simpson']

Как получить список только содержимого каждого элемента title , отдельно?

1 Ответ

0 голосов
/ 19 сентября 2018

Вы можете использовать атрибут «Содержит»:

response.css("div.announcement span[title*='Name']::text").extract()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...