Извлечение HTML Стол с HTML Строка - Python / Красивый суп - PullRequest
0 голосов
/ 06 апреля 2020

У меня есть тег таблицы, сохраненный в виде строки в списке.

Строка сохраняется следующим образом

'' '/ table .. много случайных html .. / table>

Я, по сути, хочу взять эту строку, найдите проанализированный файл html, найдите таблицу, извлеките ее и переместите в информационный кадр. Я борюсь за сопоставление строки и извлечение таблицы.

Мой код выглядит следующим образом - большое спасибо, ребята

        url = XXX
        table_tags = df['table_tags'][0]
        r = requests.get(url)
        soup = BeautifulSoup(r.content, 'html.parser')
        table_tag = table_tags[0]
        x = soup.findAll('table',table_tag)

1 Ответ

0 голосов
/ 06 апреля 2020

Если для проверки таблицы используется текст, используйте регулярное выражение re.

import re

url = XXX
table_tags = df['table_tags'][0]
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
table_tag =''.join(table_tags[0])
x = soup.findAll('table',text=re.compile(table_tag))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...