Любой API для поиска в Google Cache? - PullRequest
7 голосов
/ 23 октября 2010

Я пытаюсь выполнить поиск в Google Cache, поэтому мне нужно запустить этот запрос:

http://webcache.googleusercontent.com/search?q=cache:news.ycombinator.com/news+hacker+news

и получить некоторый контент, например отметку времени, со страницы.Но когда я делаю это с помощью curl (ruby), он выдает ошибку отказа в разрешении, т. Е. Очистка заблокирована, и это ожидалось.

Итак, есть ли способ поиска в кэше Google (либо API, либо какой-то другойобходного пути) и извлечь некоторую информацию, такую ​​как отметка времени?

Ответы [ 2 ]

2 голосов
/ 25 октября 2010

Я не получил никакого API, но я могу обработать его, используя hpricot или nokogiri в рельсах (curl в Rails дает ошибку запрещенного доступа). Я приведу код, как только выясню, как извлечь метку времени из вышеуказанного URL-адреса с помощью этих драгоценных камней.

У кого-нибудь есть лучшее решение?

0 голосов
/ 13 января 2012

Похоже, что это можно сделать: http://code.google.com/apis/soapsearch/reference.html#1_2

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...