Использование поисковых систем для получения URL - PullRequest
0 голосов
/ 27 марта 2012

Я создаю портал, который перечисляет определенные продукты и автоматически получает цены со страниц продуктов перечисленных поставщиков. Чтобы получить URL-адрес для страницы продукта на веб-сайте поставщика, я использовал Google Search API, и он отлично работал - первым результатом всегда является страница продукта. Однако теперь я получаю сообщения об ошибках, говорящих о том, что Google заблокировал мой веб-сайт (фактически IP-адрес моего компьютера для разработки) из API, поскольку я выполнял автоматические запросы, такие как очистка (единственный применимый элемент).

Хорошо, Google может спрыгнуть с обрыва, но ... как порталы продуктов обычно получают URL-адреса для своих продуктов? Я могу ввести URL-адреса вручную, но это может стать проблемой, если веб-сайт поставщика каким-либо образом изменит схему URL-адреса. Мне, очевидно, нужен автоматизированный способ сделать это.

Я делаю не более 50-60 запросов в день, поэтому я не получаю то, что хочет Google. Они хотят денег?

1 Ответ

2 голосов
/ 27 марта 2012

Во-первых, они хотят, чтобы вы использовали один из их API, а не чистили их веб-страницу напрямую.Их пользовательский API поиска задокументирован здесь .Как только вы зарегистрируетесь, они дадут вам ключ API.Вы можете получить результаты в формате JSON, запросив

https://www.googleapis.com/customsearch/v1?q=SEARCH_TERMS&key=YOUR_KEY

Во-вторых, они делают как деньги, но вы можете быть в порядке.Вам разрешено 100 поисков в день бесплатно;сверх этого вы будете платить 5 долларов за тысячу запросов.

...