Я использую pytrends для извлечения индекса запросов из Google Trends для нескольких стран с течением времени.Поскольку представляется невозможным указать несколько стран, используя гео, я использую Проценты по времени для каждой страны и перебираю список многих стран.
Проблемы:
1) Поскольку я неоднократно запускаюэтот же сценарий (с промежуточным ожиданием), каждый раз, когда полученные CSV-файлы содержат разные подмножества стран.Некоторые страны с кажущимися нормальными значениями (намного превышающими 0) в одном беге полностью исчезнут в другом беге.
2) Некоторые страны с действительными значениями при ручной загрузке с веб-сайта Trends отсутствуют при запуске сценария.
Каковы возможные причины этих проблем?Большое спасибо!
Пример кода:
from pytrends.request import TrendReq
pytrend = TrendReq()
coun=('''AU
FI
GB
HU
IL
JP
NL
NZ
PT
US
''').split()
for country in coun:
try:
pytrend.build_payload(kw_list=['holiday'], timeframe='all', geo=country)
interest_over_time_df = pytrend.interest_over_time()
interest_over_time_df.to_csv(country+'_holiday.csv')
except:
continue