Я хотел бы узнать, какова текущая кэшированная копия Google большого набора страниц. Я думаю, что мне нужно
- посмотрите в логах IP-адреса,
- проверьте, чтобы найти user-agent "googlebot", затем
- экспорт списка, в котором говорится о каждой странице и времени ее последнего посещения.
Я предполагаю, что это может быть работа cron, которая выполняется еженедельно. Если это правильно, как бы я написал сценарий? Если это не так, что может быть лучше?