Моя цель - очистить результаты поиска с помощью PHP Simple HTML DOM Parser.
который работает нормально для меня. Но через каждые один или два дня Google меняет структуру HTML, и мой код перестает работать.
Вот мой код, который работал раньше:
include("simple_html_dom.php");
$data = file_get_contents('https://www.google.com/search?q=stackoverflow');
$html = str_get_html($data);
$i=0;
$linkObjs = $html->find('h3[class=r] a');
foreach ($linkObjs as $linkObj) {
$i++;
$url = trim($linkObj->href);
$trim = substr($url, 0, 7);
if ($trim=="/url?q=") {
$url = substr($url, 7);
}
$trim_2 = stripos($url, '&sa=U');
if ($trim_2 != false) {
$url = substr($url, 0, $trim_2);
}
echo "$i:".$url.'<br>';
}
Они обычно меняют имена классов и тегов вместе со структурой HTML-ссылок