Соскобли Google результаты с страницы 1 на страницу 3 - PullRequest
0 голосов
/ 21 апреля 2020

Я понятия не имею, как почистить первую-третью страницу результатов поиска Google. После очистки результата он сохранит страницу в файл, я не добавил сохранение страницы в коде ниже.

$url = 'http://www.google.com/search?q='.$in;
$datenbank = "proxy_work.php"; 
$datei = fopen($datenbank,"w+");
$datenbank = "proxy_work.php";
fwrite($datei, $url);  
fwrite ($datei,"\r\n");
fclose($datei);
// echo file_get_contents("proxy_work.php");
$html = file_get_html("proxy_work.php");
foreach($html->find('a') as $e){
    //  $title = $h3->innertext;
    $link  = $e->href;
    //  if(in_array($endomain, $approveurl)){
            // 
        }
    // if it is not a direct link but url reference found inside it, then extract
    if (!preg_match('/^https?/', $link) && preg_match('/q=(.+)&sa=/U', $link, $matches) && preg_match('/^https?/', $matches[1])) {
        $link = $matches[1];
    } else if (!preg_match('/^https?/', $link)) { // skip if it is not a valid link
        continue;
    } 
}
...