Это то, что у меня есть:
from requests import get
url = 'https://howlongtobeat.com/game.php?id=38050'
response = get(url)
from bs4 import BeautifulSoup
html_soup = BeautifulSoup(response.text, 'html.parser')
game_name = html_soup.select('div.profile_header')[0].text
game_length = html_soup.select('div.game_times li div')[-1].text
game_developer = html_soup.find_all('strong', string='\nDeveloper:\n')[0].next_sibling
game_publisher = html_soup.find_all('strong', string='\nPublisher:\n')[0].next_sibling
game_console = html_soup.find_all('strong', string='\nPlayable On:\n')[0].next_sibling
game_genres = html_soup.find_all('strong', string='\nGenres:\n')[0].next_sibling
print(game_name)
print(game_length)
print(game_developer)
print(game_publisher)
print(game_console)
print(game_genres)
это выводит:
God of War (2018)
31 Hours
SIE Santa Monica Studio
Sony Interactive Entertainment
PlayStation 4
Third-Person, Action, Adventure
Планирование создания электронной таблицы с этими данными (как только я выясню, как извлечь Имяполя игры, длина игры Main + Extras, поля «Имя разработчика», «Издатель», «Доступный для игры» и «Жанр»
, поэтому эти данные будут храниться, и я думаю, что эти данные должны быть напечатаны, прежде чем я смогу их сохранить:
God of War (2018)
31 Hours
SIE Santa Monica Studio
Sony Interactive Entertainment
PlayStation 4
Third-Person, Action, Adventure
любая помощь будет оценена
Редактировать ---
Я провел небольшое исследование и думаю, что мне нужны Панды