Панель инструментов Google Analytics Данные и данные, импортированные через python, не совпадают с googleapiclient - PullRequest
0 голосов
/ 30 августа 2018

У меня есть пользовательский отчет в Google Analytics Dashboard. Я также получаю эти данные через Python googleapiclient. Но данные между приборной панелью и этим не совпадают. Разница между точками данных, полученными через python, составляет ~ 10%.

Вот формат объекта отчета.

def get_report(analytics, token):
        return analytics.reports().batchGet(
            body={
                'reportRequests': [
                    {
                        'viewId': VIEW_ID,
                        'dateRanges': [{'startDate': '1daysAgo', 'endDate': '1daysAgo'}],
                        'metrics': [
                            {'expression': 'ga:users'},
                            ........
                        ],
                        'dimensions': [
                            {'name': 'ga:date'},
                            {'name': 'ga:hour'},
                                ....
                        ],
                        'pageSize': 100000,
                        'pageToken': token,  
                        'samplingLevel': 'HIGH',
                    }]
            }
        ).execute()

Я считаю, что выборка не является проблемой, так как report.get ('samplesReadCounts') возвращает None.

В чем может быть проблема? Проверено в проводнике запросов. Также не соответствует.

1 Ответ

0 голосов
/ 30 августа 2018

Это, вероятно, делать с задержкой. Вы не должны пытаться запрашивать данные вчерашнего дня из Google Analytics, большую часть времени данные не завершали обработку в течение по крайней мере 24 -48 часов.

Вы можете проверить это, проверив isDataGolden в ответе.

Указывает, является ли ответ на этот запрос золотым или нет. Данные являются золотыми, когда точно такой же запрос не даст никаких новых результатов, если их спросить в более поздний момент времени.

При этом очень трудно сделать так, чтобы отчеты на веб-сайте точно соответствовали данным, возвращаемым API. Вам необходимо запрашивать те же точные даты, измерения и метрики, на которых был построен отчет, и может быть очень сложно узнать, какие измерения и показатели использовались в некоторых отчетах на веб-сайте.

Даже установка sampliingLevel на HIGH не мешает сэмплированию.

...