Scrapy + Python + Xpath: точка данных не может быть очищена всегда - PullRequest
0 голосов
/ 21 сентября 2018

Я хочу очистить адрес с этой страницы:

http://calendar.youtoocanrun.com/events/chennai-1/kanchipuram-half-marathon-2018-3rd-edition/

enter image description here

Когда я пишу этот xpath:

response.xpath('//span[@itemprop]/text()').extract()

Я получаю желаемый результат, то есть список, содержащий элементы адреса:

[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']

Но когда я пишу этот xpath:

response.xpath('//div[@class="geodir_more_info post_address"]//span[@itemprop]/text()').extract()

Я получаю пустой список.

Почему?

1 Ответ

0 голосов
/ 21 сентября 2018

Поскольку между классами div (geodir_more_info и post_address) есть два пробела.

Ввод:

response.xpath('//div[@class="geodir_more_info  post_address"]/span[@itemprop]/text()').extract()

Выход:

[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']
...