Выбор элементов между двумя текстовыми значениями на веб-странице с помощью селена - PullRequest
1 голос
/ 31 марта 2020

Я пытаюсь очистить текстовые значения от веб-сайта . Я заинтересован в синонимах разделе , однако используемые теги также используются на сайте для других разделов.

В настоящее время я пытаюсь получить элементы ниже "Синонимы" и выше "Статьи", так как это единственный способ, которым я могу выделить этот раздел

synsection = driver.find_elements_by_xpath("*[following::div[text()='Synonyms:'] and preceding::div[text()='Articles:']]") 

Может кто-нибудь помочь я изолировать раздел, чтобы вытащить текст синонимов.

Я использую селен (python)

1 Ответ

0 голосов
/ 31 марта 2020

Если вам это нужно в табличной форме, где каждая строка представляет собой строку df, вы можете использовать следующие две строки: -

import pandas as pd

page = 'http://www.thegoodscentscompany.com/data/rw1023571.html#tosynm'

df = pd.read_html(page)[-2]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...