Я пишу скрипт на Python, чтобы очистить 100 лучших игр от metacritic.com.
Я использовал bs4 findAll () для создания ResultSet для списка элементов с {"class": "product_row game"}.
Когда я проверял len (prods), он возвращался "98" .После осмотра я заметил, что первый и последний элементы в списке имеют {"class": "product_row game first"} и {"class": "product_row game last"} соответственно.
Я планировал создать 3 отдельных ResultSet и объединить их, но я не могу найти в Интернете ресурсы для этого.Это реально / умно сделать это было?Если так, указатель будет оценен.Если нет, то как мне изменить свой подход?
Заранее спасибо, Гэвин :) 100 *
from urllib.request import Request, urlopen
from bs4 import BeautifulSoup as soup
url = 'https://www.metacritic.com/browse/games/score/metascore/all/all/filtered?sort=desc'
req = Request(url, headers={'User-Agent': 'Mozilla/5.0'})
web_byte = urlopen(req).read()
webpage = web_byte.decode('utf-8')
urlopen(req).close()
page_soup = soup(webpage, "html.parser")
prod_f = page_soup.findAll("div", {"class":"product_row game first"})
prods = page_soup.findAll("div", {"class":"product_row game"})
prod_l = page_soup.findAll("div", {"class":"product_row game last"})