результаты поиска в Интернете - PullRequest
0 голосов
/ 27 июля 2011

Мне нужна помощь в решении следующей проблемы:

Мне нужно проверить кэшированные URL-адреса поисковой системой Google для определенного сайта.В случае, если URL-адрес будет 404 или страница не будет отображать некоторые необходимые элементы HTML (считаются неработающими), мне нужно зарегистрировать эти URL-адреса, а затем 301 перенаправить на правильные URL-адреса.Я знаю PHP и немного Python, но я не уверен, какой подход использовать для удаления всех URL из результатов поисковой системы для данного сайта.

1 Ответ

0 голосов
/ 27 июля 2011

http://simplehtmldom.sourceforge.net/ - простой html-парсер. на этой странице есть пример; не уверен, что это все еще работает с мгновенным поиском Google и т. д.

...