Я собираю данные с веб-сайта, используя simple_html_dom. Мне нужно удалить 11 000 URL, но после запроса 200 или 250 я всегда получаю бан, как легко это сделать.
Я делаю спящий вызов как 3,4,5 секунды и т.д., используя user-agent с использованием прокси. Я уже оптимизировал скрипт
$url = "https://www.example.org?id=dynamic_id";
$html = new simple_html_dom();
$options = array(
"http"=>array(
"header"=>"User-Agent: Mozilla/5.0 (iPad; U; CPU OS 3_2 like Mac OS X; en-us) AppleWebKit/531.21.10 (KHTML, like Gecko) Version/4.0.4 Mobile/7B334b Safari/531.21.102011-10-16 20:23:10\r\n" // i.e. An iPad
)
);
$context = stream_context_create($options);
$html = file_get_html($url, false, $context);
<--Scraping Code is here-->
Я также пробовал прокси.$ context = array ('http' => array ('proxy' => "tcp: // $ proxies_array", 'request_fulluri' => true,),);
Как я могу это сделать, не получивзапрет.Я уже искал много похожих вещей в Google, но не смог выяснить, пожалуйста, помогите мне, если кто-то знает об этом.