Я пытаюсь получить цены на акции, просматривая страницы финансов Google, я делаю это на python, использую пакет urllib, а затем использую регулярное выражение для получения ценовых данных.
Когда я оставляю свой скрипт на Python запущенным, он сначала работает некоторое время (несколько минут), а затем начинает выдавать исключение [Ошибка HTTP 503: служба недоступна]
Я полагаю, это происходит потому, что на стороне веб-сервера он обнаруживает частые обновления страниц как робот и через некоторое время выдает это исключение ..
есть ли способ обойти это, то есть удалить некоторые файлы cookie или создать некоторые файлы cookie и т. Д.
или даже лучше, если Google дает API, я хочу сделать это на python, потому что готовое приложение на python, но если в python нет ничего доступного для этого, я могу рассмотреть альтернативы. Это мой метод python, который я использую в цикле для получения данных (после нескольких секунд сна я вызываю этот метод в цикле)
def getPriceFromGOOGLE(self, symbol):
"""
gets last traded price from google for given security
"""
toReturn = 0.0
try:
base_url = 'http://google.com/finance?q='
req = urllib2.Request(base_url + symbol)
content = urllib2.urlopen(req).read()
namestr = 'name:\"' + symbol + '\",cp:(.*),p:(.*),cid(.*)}'
m = re.search(namestr, content)
if m:
data = str(m.group(2).strip().strip('"'))
price = data.replace(',','')
toReturn = float(price)
else:
print 'ERROR ' + str(symbol) + ' --- ' + str(content)
except Exception, exc:
print 'Exc: ' + str(exc)
finally:
return toReturn