BeautifulSoup и Pandas: разбирать внутреннюю таблицу как уникальное значение в столбце DataFrame - PullRequest
0 голосов
/ 17 марта 2020

Я пытаюсь извлечь таблицу из определенного веб-сайта и преобразовать ее в словарь. Для этого я использую Selenium, Pandas и BeautifulSoup.

Мой код:

element = driver.find_element_by_xpath('//*[@id="buscaQualquerForm"]/table[2]')
html_content = element.get_attribute('outerHTML')
soup = BeautifulSoup(html_content, 'html.parser')
table = soup.find(name='table')
df_full = pd.read_html(str(table))[0]
df = df_full[['Numero', 'Participantes', 'Classe', 'Área']]
df.columns = ['num', 'clients', 'class', 'area']
dfdict = df.to_dict('records')

Проблема в том, что в каждой строке в столбце "клиенты" есть внутренняя таблица, содержащая имя нескольких клиентов, связанных с этим номером.

Итак, мне нужно, чтобы значения в этой таблице были распознаны как одно значение (строка) для вставки в этот ключ.

Например:

dict = {'costumers': 'First Person: John Doe Second Person: Jane Doe'}

Итак, как мне заставить pandas распознать эту внутреннюю таблицу как уникальное значение?

Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...