Xpath + Scrapy + Python: точка данных не может быть очищена - PullRequest
0 голосов
/ 19 сентября 2018

Это структура XML:

<tr>
   <td>
       <font size="3">
           <strong>Location:</strong> 
           Hiranandani Gardens, Powai
       </font>
   </td> 
</tr>  

Я хочу извлечь: Hiranandani Gardens, Powai

Я пробовал с этим:

response.xpath('//font[@size="3"]/strong[text()="Location:"]/text()').extract()

response.xpath('//font[@size="3"]/strong[text()="Location:"]').extract()

Оба вернулипустой список.

Примечание: мы должны использовать текст тега, то есть «Location:».В противном случае на сайте есть много других мест, где используется та же XML-структура.Так что, если текст сильного тега не используется, он извлечет еще больше ненужных вещей, кроме желаемого значения.

1 Ответ

0 голосов
/ 19 сентября 2018

Попробуйте ниже XPath, чтобы получить требуемый вывод

//font[@size="3" and normalize-space(strong)="Location:"]/text()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...