скрап, как скрести случайный текст или без класса и идентификатора - PullRequest
0 голосов
/ 05 ноября 2019

Я пытаюсь очистить текст, 1 910 400 и даты начала и окончания, как на рисунке ниже, но это просто случайный текст без класса div или идентификатора. Как очистить его, используя определенный формат?

Формат кодирования, который я сейчас использую:

enter image description here

Тег HTML-кода:

enter image description here

1 Ответ

1 голос
/ 05 ноября 2019

Попробуйте этот XPath (найдите div, который содержит strong, это значение Max ERC Funding, и затем получите следующий текстовый узел):

quote.xpath('.//div[strong[.="Max ERC Funding"]]/following-sibling::text()[1]').get()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...