Scrapy CSS Selector для выбора текста и бланка - PullRequest
0 голосов
/ 08 июня 2018

Поскольку я использую скрап для очистки сайта, содержащего таблицу.Я использую селектор CSS для получения элементов для класса attr.Пример кода приведен ниже.

<span class="attr">Tamil Nadu - Greenshore Energy</span>
<span class="attr"></span>
<span class="attr">India</span>

Я использую селектор

response.css('.attr::text').extract()

Чтобы получить весь текст и пробелы в промежутке.Но вышеупомянутый селектор возвращается только ниже списка.Оставляя пустые промежутки.

[u'Tamil Nadu - Greenshore Energy ', u'India']

Так какой селектор я должен использовать, чтобы получить все промежутки,содержит текст или нет.

1 Ответ

0 голосов
/ 08 июня 2018

Вы можете сделать следующее:

>>> [tag.css('::text').extract_first(default='') for tag in response.css('.attr')]
['Tamil Nadu - Greenshore Energy', '', 'India']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...