всех,
Я хотел бы просмотреть историю травм всех игроков. Для этой цели я создал Python скребок.
У меня есть функция, в которой я могу указать player_id_start и player_id_end, а затем запускается скребок. Скребок частично работает с pandas и частично с BeautifulSoup.
Примерно через 10 игроков я получаю status_code 403 от Transfermarkt.de. Я предполагаю, что какая-то система защиты блокирует мои запросы. Примерно через 5 минут я снова «разблокирован».
Я что-то забыл или мне просто нужно установить несколько таймеров сна? Я тоже не хочу захлопывать сервер.
Надо ли обращать внимание на что-то с заголовком или вообще на запросы? В настоящее время используется следующее:
requests.get(url, headers=heads)
heads = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'}
Я уверен, что у вас есть еще несколько мест, с которых я могу начать. Ведь идентификаторов игроков 600 000.
Спасибо