Итак, я пытаюсь сканировать данные ниже. И проблема в том, что я не знаю, сколько tr
находится на веб-сайте, поэтому я просто сказал range(0, 24)
. Однако я почти уверен, что у него как минимум 24. Но код по-прежнему говорит, что он выходит за пределы допустимого диапазона.
Как мне сканировать этот веб-сайт и получить всю информацию (двуязычный текст), даже если я этого не сделаю? Не знаете, сколько там строк?
Ниже мой код.
from bs4 import BeautifulSoup
import requests
url="http://www.mongols.eu/mongolian-language/mongolian-tale-six-silver-stars/"
html_content = requests.get(url).text
soup = BeautifulSoup(html_content, "lxml")
gdp_table = soup.find("table", attrs={"class": "table-translations"})
gdp_table_data = gdp_table.tbody.find_all("tr") # contains # rows
for i in range(0, 24):
for td in gdp_table_data[i].find_all("td"):
headings = []
headings.append(td.get_text(strip=True))
print(headings[1], " | ", headings[2])