Я пытаюсь извлечь информацию на основе указанного шаблона c в коде HTML. В идеале я хотел бы извлечь текст для класса div, который упоминает только «bg-deep-green». Я новичок в регулярных выражениях, поэтому я не был уверен, есть ли способ использовать их или любой другой метод через xpath.
Вот пример HTML:
<div class="flex flex-row w-full mb-lg">
<div class="flex text-center text-sm text-white rounded-l-full bg-green">< 30</div>
<div class="flex text-center text-sm text-white bg-green">30 - 78</div>
<div class="flex text-center text-sm text-white rounded-r-full bg-deep-green">> 78</div></div>
У меня есть xpath для родительского элемента, который очищает все теги.
response.xpath('//*[@class="flex flex-row w-full mb-lg"]//@class').extract()
Кроме того, xpath, который очищает весь текст для тегов.
response.xpath('//*[@class="flex flex-row w-full mb-lg"]//text()').extract()
Наихудший сценарий Я мог бы разобрать его после очистки, я думаю, но было бы неплохо, если бы я мог сделать это до очистки.
Я пытался использовать contains
различными способами и с использованием обозначения string
в документации. Ниже приведены некоторые из моих попыток, однако, я могу неправильно понять содержание документации.
response.xpath('//*[@class="flex flex-row w-full mb-lg"]/div/[contains("bg-deep-green")]/text()')
response.xpath('//*[@class="flex flex-row w-full mb-lg"]/div/[contains(., "bg-deep-green")]')