Текст Scrapy после <div> - PullRequest
0 голосов
/ 31 мая 2018

Я хочу сканировать следующий код HTML с помощью Scrapy:

<tbody id="pageData11">
<tr>
<td>
<div style="border-left:3px solid #1A8CFF  !important; float: left; padding-right: 5px;">&nbsp;</div>
2018-May-29 Tuesday
</td>

Ответы [ 2 ]

0 голосов
/ 31 мая 2018

Просто учитывая ваш данный пример в вопросе.

response.css('td::text').extract())
0 голосов
/ 31 мая 2018

Строго говоря, ответ на ваш вопрос - response.xpath('/html/body/tbody/tr/td/div/following::text()').extract_first().strip(), но в данном случае это также текст в td.Таким образом, вы также можете сделать что-то вроде "".join(i.strip() for i in response.css('td::text').extract()).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...