Beautifulsoup python Howlongtobeat.com извлекает элементы и экспортирует их в .csv - PullRequest
0 голосов
/ 09 июня 2018

Это то, что у меня есть:

from requests import get



url = 'https://howlongtobeat.com/game.php?id=38050'

response = get(url)

from bs4 import BeautifulSoup

html_soup = BeautifulSoup(response.text, 'html.parser')

game_name = html_soup.select('div.profile_header')[0].text
game_length = html_soup.select('div.game_times li div')[-1].text
game_developer = html_soup.find_all('strong', string='\nDeveloper:\n')[0].next_sibling
game_publisher = html_soup.find_all('strong', string='\nPublisher:\n')[0].next_sibling
game_console = html_soup.find_all('strong', string='\nPlayable On:\n')[0].next_sibling
game_genres = html_soup.find_all('strong', string='\nGenres:\n')[0].next_sibling

print(game_name)
print(game_length)
print(game_developer)
print(game_publisher)
print(game_console)
print(game_genres)

это выводит:

God of War (2018) 
31 Hours 

SIE Santa Monica Studio 

Sony Interactive Entertainment 

PlayStation 4 

Third-Person, Action, Adventure 

Планирование создания электронной таблицы с этими данными (как только я выясню, как извлечь Имяполя игры, длина игры Main + Extras, поля «Имя разработчика», «Издатель», «Доступный для игры» и «Жанр»

, поэтому эти данные будут храниться, и я думаю, что эти данные должны быть напечатаны, прежде чем я смогу их сохранить:

God of War (2018) 
31 Hours 
SIE Santa Monica Studio
Sony Interactive Entertainment
PlayStation 4
Third-Person, Action, Adventure

любая помощь будет оценена

Редактировать ---

Я провел небольшое исследование и думаю, что мне нужны Панды

1 Ответ

0 голосов
/ 10 июня 2018

Если я вас правильно понял, вы можете удалить пробелы, применяя strip() к вашей строке.После этого вы можете создать CSV-файл, в котором будут храниться ваши данные в формате df:

f = open(path_where_to_save + 'info.csv', 'a')
f.write(str(game_name)+ ',' + str(game_length) + ',' + str(game_developer))
f.close()

Обратите внимание на a в open, который добавляется вместо перезаписи первой строки

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...