Я пытаюсь собрать данные с сайта, который отслеживает случаи заражения коронным вирусом. Веб-сайт "https://www.coronatracker.com/"
Таблица, которую я пытаюсь очистить, выглядит так: Таблица записей короны
Если мы посмотрим на это элемент html, в нем есть элемент table, содержащий thead и tbody. Я пытаюсь прочитать всю таблицу, но моя попытка привела к чтению только заголовков. Я также хочу прочитать содержание таблицы.
Вот код, который я написал, и надеялся, что смогу прочитать таблицу:
import requests
from bs4 import BeautifulSoup
url = "https://www.coronatracker.com/"
html_page = requests.get(url)
soup = BeautifulSoup(html_page.text, 'html.parser')
#pointing to div that is parent to table
data = soup.find('div' , {'class':'w-full block md:hidden mt-4 mb-8'})
#pointing to table
tables = data.find_all('table' , {'class':'table-auto w-full'})
#printing out the headings
for table in tables:
print(table.text)
#printing out the contents
body = table.find('tbody')
for data in body.find_all('tr'):
print(data)
Проблема с чтением содержимого таблицы, заголовки читаются отлично.