Я строю веб-скребок как небольшой проект (используя CodeIgniter ). Из-за политики CORS мне не разрешается получать данные с некоторых сайтов.
Чтобы обойти это, я использую CORS Anywhere Роба Ву. Я добавляю cors_url к URL, с которого я удаляю данные.
Все работает, пока я не достигну максимально допустимого предела в 200 запросов в час. После нажатия 200 раз я получаю код состояния HTTP: 429 ( Слишком много запросов ).
Снимок экрана, показывающий журнал сети.
Согласно документации, мы можем создать экземпляр нашего собственного сервера. js на Heroku . Но я хочу настроить его локально для моего локального Apache сервера ( localhost ), просто чтобы сначала проверить все.
Пример код:
var url = "http://example.com/";
var cors_url = "https://cors-anywhere.herokuapp.com/";
$.ajax({
method:'GET',
url : cors_url + url,
success : function(response){
//data_scraping_logic...
}
}