Текст Scrapy Crawl после <div> - PullRequest
0 голосов
/ 13 мая 2018

Я хочу сканировать следующий код HTML с помощью Scrapy:

<td class="xyz"> 
   <div>Irrelevant</div>
   I want to get this text! 
</td>

Как мне извлечь этот текст?

response.css('td.xyz::text').extract()

возвращает ''

Ответы [ 2 ]

0 голосов
/ 13 мая 2018

Даже если дополнительный div существует или нет, вы можете сделать это, чтобы получить нужный текст

response.css('td.xyz::text').extract()[-1]
0 голосов
/ 13 мая 2018
response.xpath('//td[@class="xyz"]/text()[2]').extract_first()
...