Я пишу Python, чтобы очистить номера лотереи и другие столбцы в таблице.
Проблема, с которой я столкнулся, пытается извлечь январь 2001 в следующем январе 2001 с использованием Python и BeautifulSoup.
Код, который я создал до сих пор
import requests
from bs4 import BeautifulSoup
URL = "https://www.lotterysearch.org/results/2001"
headers = {
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.1 Safari/605.1.15"
}
page = requests.get(URL, headers=headers)
soup = BeautifulSoup(page.content, "html.parser")
table = soup.find("table", {"style": "width:100%"})
# Get each table row 'tr'
for row in table.find_all("tr"):
cells = row.findAll("td")
# print(row.find("td").find("a"))
draw_year = cells[0].find("a")
draw_date = cells[0].find(text=True)
# draw_date = cells[0].find(text=True)
winning_numbers = cells[1].find(text=True)
jackpot = cells[3].find(text=True)
draw_number = cells[4].find(text=True)
print(draw_year)
Выводятся следующие результаты:
Январь 2001
Я мог бы выполнить некоторые подстроки, чтобы вытащить январь 2001 года, но хочу найти правильный метод для этого.