Я пытаюсь очистить веб-сайт, но получаю ошибку HTTP 429 с моим текущим кодом (слишком много запросов).
Я пытался добавить интервал ожидания, а также случайный интервал ожиданияно это не работает, я получаю сообщение об ошибке после примерно 100 наблюдений.
noplayers <- 300 # the amount of players I want to run the loop for while testing my code
playeridtest <- playerid[1:noplayers] # assign the three IDs to a vector
playernames <- NULL
playernames$id <- playeridtest
for(i in seq_along(playeridtest)) {
scoresway <- paste("http://www.scoresway.com?sport=soccer&page=person&id=",playeridtest[i], sep="")
scoresway <- read_html(scoresway)
urlnodescorefirst <- html_node(scoresway, "dd:nth-child(2)")
urltextscorefirst <- html_text(urlnodescorefirst)
playernames$first[i] <- urltextscorefirst
urlnodescoresur <- html_node(scoresway, "dd:nth-child(4)")
urltextscoresur <- html_text(urlnodescoresur)
playernames$sur[i] <- urltextscoresur
Sys.sleep(sample(10, 1) * 0.1)
}
Полная ошибка:
Ошибка в open.connection (x, "rb"): Ошибка HTTP 429.
Может кто-нибудь найти способ обойти эту ошибку?У меня есть около 98 тысяч наблюдений, которые я хочу очистить.