начинающий программист и тайник, надеясь получить какой-нибудь разумный совет. :)
Используя комбинацию Python, BeautifulSoup и Bing API, я смог найти то, что хотел, с помощью следующего кода:
import urllib2
from BeautifulSoup import BeautifulStoneSoup
Appid = #My Appid
query = #My query
soup = BeautifulStoneSoup(urllib2.urlopen("http://api.search.live.net/xml.aspx?Appid=" + Appid + "&query=" + query + "&sources=web"))
totalResults = soup.find('web:total').text
Так что я хотел бы сделать это через несколько тысяч поисковых терминов, и мне было интересно, если
- выполнение этого запроса тысячу раз было бы истолковано как удар по серверу,
- какие шаги я должен предпринять, чтобы не забивать указанные серверы (каковы лучшие практики?), И
- существует ли более дешевый (с данными) способ сделать это с помощью любого из основных API поисковых систем?
Просто кажется неоправданно дорогим собирать все эти данные, чтобы просто получить одно число за ключевое слово, и мне было интересно, пропустил ли я что-нибудь.
FWIW, я выполнил некоторую домашнюю работу и попробовал API поиска Google (устарел) и API BOSS Yahoo (вскоре будет объявлен устаревшим и заменен платным сервисом), прежде чем перейти к использованию Bing API. Я понимаю, что прямая очистка страницы считается плохой формой, поэтому я перейду непосредственно к поисковым системам.