Извлечь текст из класса div с помощью scrapy - PullRequest
0 голосов
/ 06 октября 2018

Я использую питона вместе с scrapy.Я хочу извлечь текст из тега div, который находится внутри класса div.Например:

 <div class="ld-header">
    <h1>2013 Gulfstream G650ER  for Sale</h1>
    <div id="header-price">Price - $46,500,000</div>
</div>

Я извлек текст из тега h1

result.xpath('//div[@class="ld-header"]/h1/text()').extract()

, но я не могу извлечь Price.Я пробовал

'price': result.xpath('//div[@class="ld-header"]/div[@id="header-price"]/text()').extract()

1 Ответ

0 голосов
/ 06 октября 2018

Поскольку у вас есть идентификатор, вам не нужно использовать полный путь к элементу.Идентификаторы уникальны для каждой веб-страницы:

Этот Xpath:

//div[@id="header-price"]/text()

, использованный в XML XML для выдачи, вернет:

'Price - $46,500,000'

Для отладки селекторов Xpath и CSS я всегдаполезно использовать онлайн-чекер (просто воспользуйтесь Google, чтобы найти некоторые предложения).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...