Question

Это структура XML:

<tr>
   <td>
       <font size="3">
           <strong>Location:</strong> 
           Hiranandani Gardens, Powai
       </font>
   </td> 
</tr>

Я хочу извлечь: Hiranandani Gardens, Powai

Я пробовал с этим:

response.xpath('//font[@size="3"]/strong[text()="Location:"]/text()').extract()

response.xpath('//font[@size="3"]/strong[text()="Location:"]').extract()

Оба вернулипустой список.

Примечание: мы должны использовать текст тега, то есть «Location:».В противном случае на сайте есть много других мест, где используется та же XML-структура.Так что, если текст сильного тега не используется, он извлечет еще больше ненужных вещей, кроме желаемого значения.

Andersson · Answer 1 · 19 сентября 2018

Попробуйте ниже XPath, чтобы получить требуемый вывод

//font[@size="3" and normalize-space(strong)="Location:"]/text()

Xpath + Scrapy + Python: точка данных не может быть очищена

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Xpath + Scrapy + Python: точка данных не может быть очищена

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов