Question

Я пытаюсь очистить текстовые значения от веб-сайта . Я заинтересован в синонимах разделе , однако используемые теги также используются на сайте для других разделов.

В настоящее время я пытаюсь получить элементы ниже "Синонимы" и выше "Статьи", так как это единственный способ, которым я могу выделить этот раздел

synsection = driver.find_elements_by_xpath("*[following::div[text()='Synonyms:'] and preceding::div[text()='Articles:']]")

Может кто-нибудь помочь я изолировать раздел, чтобы вытащить текст синонимов.

Я использую селен (python)

Prakhar Jhudele · Answer 1 · 31 марта 2020

Если вам это нужно в табличной форме, где каждая строка представляет собой строку df, вы можете использовать следующие две строки: -

import pandas as pd

page = 'http://www.thegoodscentscompany.com/data/rw1023571.html#tosynm'

df = pd.read_html(page)[-2]

Выбор элементов между двумя текстовыми значениями на веб-странице с помощью селена

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Выбор элементов между двумя текстовыми значениями на веб-странице с помощью селена

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов