Question

Поскольку я использую скрап для очистки сайта, содержащего таблицу.Я использую селектор CSS для получения элементов для класса attr.Пример кода приведен ниже.

<span class="attr">Tamil Nadu - Greenshore Energy</span>
<span class="attr"></span>
<span class="attr">India</span>

Я использую селектор

response.css('.attr::text').extract()

Чтобы получить весь текст и пробелы в промежутке.Но вышеупомянутый селектор возвращается только ниже списка.Оставляя пустые промежутки.

[u'Tamil Nadu - Greenshore Energy ', u'India']

Так какой селектор я должен использовать, чтобы получить все промежутки,содержит текст или нет.

stasdeep · Answer 1 · 08 июня 2018

Вы можете сделать следующее:

>>> [tag.css('::text').extract_first(default='') for tag in response.css('.attr')]
['Tamil Nadu - Greenshore Energy', '', 'India']

Scrapy CSS Selector для выбора текста и бланка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Scrapy CSS Selector для выбора текста и бланка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы