Внутри Tbody есть 8 отдельных тегов tr с их собственным содержимым. Я считаю 8 в источнике со страницы, и когда я запускаю len (inTbody), он сообщает мне 8, поэтому я знаю, что есть 8 тегов tr. Однако когда я делаю inTbody [0], он возвращает пустое значение. inTbody [1] дает мне содержимое только первого тега tr. Когда я делаю inTbody [7], он перечисляет содержимое 4-го тега tr, который действительно должен быть 3-м тегом tr из-за компьютерных индексов, но наряду с перечислением содержимого 4-го тега tr, он перечисляет содержимое 5-го, 6-го , 7-е и 8-е! Это кажется настолько произвольным и случайным, что я потратил более часа, пытаясь выяснить порядок индексов среди тегов и содержимого, и я действительно потерялся.
import csv
import bs4
import urllib
from urllib.request import urlopen as uReq
from urllib.request import Request, urlopen
from bs4 import BeautifulSoup as soup
#For sites that can't be opened due to Urllib blocker, use a
#Mozilla User agent to get access
pageRequest = Request('https://coronavirusbellcurve.com/', headers
= {'User-Agent': 'Mozilla/5.0'})
htmlPage = urlopen(pageRequest).read()
page_soup = soup(htmlPage, 'html.parser')
#overarchDiv = page_soup.findAll("div",{"class": "main"})
specificDiv = page_soup.find("div", {"class": "table-responsive-
xl"})
inTbody = specificDiv.table.tbody.contents
print(len(inTbody))
print(inTbody[7])