Я попробовал систему GeekLad, к сожалению, произошли два критических изменения. # 1 URL изменился (я изменил и разместил свою собственную копию, что привело к тому, что аргументы # 2 type = rss больше не работают.
Мне нужно было толькометки времени ... так начался лучший / худший хак, который я когда-либо писал.
Шаг 1 - https://stackoverflow.com/a/3177718/9908 - Использование chrome отключает ВСЕ протоколы безопасности.
Шаг 2- https://gist.github.com/devdave/22b578d562a0dc1a8303
Используя contentscript.js и manifest.json, создайте расширение chrome, локально разместите ransack.js для любой службы (PHP, Ruby, Python и т. Д.). Перейти к https://history.google.com/history/ после установки расширения ContentScript в режиме разработчика (без упаковки). Он автоматически внедрит ransack.js + jQuery в dom, соберет данные и перейдет к следующей ссылке «Позже».
Каждые 60 секунд Google вынуждает вас повторно входить в систему случайным образом, так что это не начальный и уходящий процесс, НО он работает, и если они повышают ставку, вы всегда можете прибегнуть к цепочке вызовов Ajaxи отправить страницу обратно на сервер для последующей обработки.При полном наклоне мой сценарий мерзости собирал 1 страницу в секунду данных.
По моральным соображениям я никому не помогу изменить этот сценарий для получения условий поиска и результатов, поскольку этот процесс не санкционирован Google (хотя и не заблокирован).по-видимому) и рекомендую это только достаточно мотивированным людям, чтобы заставить это работать на них.По моим оценкам, мне потребовалось 3-4 часа, чтобы получить данные за все 9 лет (записи по 90 КБ) @ 1 страница каждые 900 мс или быстрее.
Пока идет такая работа, НЕ просматривайте остальную часть Интернета, потому чтоChrome работает без каких-либо мер безопасности, большинство из них существуют по какой-то причине.