Проблема с удалением веб-страниц с использованием python, BeautifulSoup и pandas 'read_ html' - PullRequest
1 голос
/ 29 мая 2020

Спасибо за помощников!

Я отбрасываю таблицу данных о covid19 и pu sh во фрейм данных pandas, он работал до сегодняшнего утра.

Это код:

import pandas as pd
import requests
from bs4 import BeautifulSoup


url = 'https://www.worldometers.info/coronavirus/'

req = requests.get(url)

page = BeautifulSoup(req.content, 'html.parser')

table = page.find_all('table',id="main_table_countries_today")[0]

print(table)

df = pd.read_html(str(table))[0]

Сегодня утром я начинаю получать следующую ошибку:

ValueError: No tables found matching pattern '.+'

Не могли бы вы помочь мне разобраться?

1 Ответ

1 голос
/ 29 мая 2020

Попробуйте изменить последнюю строку на: df = pd.read_html(str(table), displayed_only=False)[0] Заголовок таблицы по URL-адресу изменил свой атрибут стиля на style = "width: 100%; margin-top: 0px! Important; display: none;". Раньше для него не был установлен тег display.

...