Я использую pytrends для загрузки интереса к поиску газет по районам метро. Вот пример для одной области метро (Остин, Техас):
from pytrends.request import TrendReq
import pandas as pd
code='US-TX-635'
papers=['The Wall Street Journal','New York Post','The New York Times','Boston Herald','San Francisco Chronicle']
pytrend = TrendReq()
pytrend.build_payload(kw_list=papers,cat=408,timeframe='all',geo=code)
test = pytrend.interest_over_time()
Я понимаю, что в Google Trends есть некоторая случайность (упоминаемая в этом посте) , но различия я Я получаю больше драм c, чем они должны быть основаны на этом, и они сохраняются, даже когда я беру много выборок и усредняю по ним. Например, когда я выполняю поиск пяти газет на сайте Google Trends, в то время как точные цифры меняются, всегда бывает так, что газеты в порядке популярности: New York Times, Wall Street Journal, New York Post, Сан-Франциско. Хроника, Бостон Вестник. Это не относится ни к одному из образцов, которые я получаю из pytrends. Кроме того, как и следовало ожидать, поисковый интерес к большинству бумаг достигает пика во время финансового кризиса, согласно данным с сайта, но это также не относится к данным по трендам.
Для справки, вот запрос, который я сделал на сайте.
Кто-нибудь знает, почему это может происходить или есть другой API, который может дать более точный результаты