Я извлекаю данные со страницы html с помощью xpath и хочу получить указанную c информацию, расположенную в текстовой части.
>>> response.xpath('//*[@id="productDetails"]/div[1]/div[2]/div[2]/text()').extract()
['\nInhalt: 10 Stück', '\nGrundpreis: 1 Stück 0,14 €']
Это возвращает мне требуемую информацию в словаре, наряду с несколькими другими данными.
Теперь я пытаюсь получить нужную информацию с помощью регулярных выражений, так как я не знаю позицию, она меняется. Поэтому я фильтрую:
>>> r = re.compile('.*Grundpreis.*')
>>> newlist = list(filter(r.match, data))
Как-то это не работает и возвращает пустой список:
>>> newlist
[]
Я следовал примерам, найденным на SO, который работал, но этот нет. Единственное отличие, которое я смог найти, это то, что мой пример - одинарные кавычки вместо двойных. Но кажется, что это невозможно изменить с помощью команды xpath.
Как извлечь нужную информацию "Grundpreis: ..." без индекса ключа?