У меня есть набор поисковых запросов размером ок. 10 миллионов Цель состоит в том, чтобы собрать количество хитов, возвращаемых поисковой системой для всех из них. Например, Google возвращает около 47 500 000 для запроса «stackoverflow».
Проблема в том, что:
1 - Google API ограничен 100 запросами в день. Это далеко не полезно для моей задачи, так как мне нужно было бы получить много отсчетов.
2 - Я использовал Bing API, но он не возвращает точное число. Накапливайте в смысле совпадения количества совпадений, отображаемых в интерфейсе Bing. Кто-нибудь сталкивался с этим вопросом раньше?
3- Отправка поисковых запросов в поисковую систему и анализ html - это одно из решений, но оно приводит к CAPTCHA и не масштабируется до этого количества запросов.
Все, что меня волнует, - это количество обращений, и я открыт для любых предложений.
simchona: что вы подразумеваете под опросом людей? :)
hackartist: спасибо за ваш комментарий и статью.