Я хочу очистить адрес с этой страницы:
http://calendar.youtoocanrun.com/events/chennai-1/kanchipuram-half-marathon-2018-3rd-edition/
Когда я пишу этот xpath:
response.xpath('//span[@itemprop]/text()').extract()
Я получаю желаемый результат, то есть список, содержащий элементы адреса:
[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']
Но когда я пишу этот xpath:
response.xpath('//div[@class="geodir_more_info post_address"]//span[@itemprop]/text()').extract()
Я получаю пустой список.
Почему?
Поскольку между классами div (geodir_more_info и post_address) есть два пробела.
div
geodir_more_info
post_address
Ввод:
response.xpath('//div[@class="geodir_more_info post_address"]/span[@itemprop]/text()').extract()
Выход: