В среднем на моем веб-сайте около 300 тыс. Сеансов в неделю, и Google Analytics начинает возвращать выборочные данные около 500 тыс. Сеансов. Это означает, что если я пытаюсь получить данные для чего-либо в течение недели, я получаю выборочные данные - я хочу избежать этого.
Мне нужна помощь, чтобы выяснить, как выполнять итерацию по большему диапазону дат (повторяется еженедельно / ежедневно) , чтобы я мог избежать выборки.
Для справки, я добавил код, который я использую для извлечения данных из моей учетной записи GA:
from google2pandas import *
import numpy as np
import pandas as pd
import time
import datetime
##-----------SETUP-----------##
SCOPES = ['https://www.googleapis.com/auth/analytics.readonly']
KEY_FILE_LOCATION = 'client_secrets.json'
VIEW_ID = 'XXXXXXX'
START_DATE = '2018-01-01'
END_DATE = '2018-08-31'
##-----------PULLING IN DATA-----------##
query1 = {
'reportRequests': [{
'viewId' : VIEW_ID,
'dateRanges' : [{'startDate': START_DATE,'endDate': END_DATE}],
'dimensions' : [{'name': 'ga:date'}],
'metrics' : [{'expression': 'ga:sessions'}]
}]
}
conn = GoogleAnalyticsQueryV4(secrets= KEY_FILE_LOCATION)
df = conn.execute_query(query1)
df.head()
Запрос упрощен, только для извлечения дат и сессий (чтобы упростить тестирование) , но, если кому-то интересен контекст, наши определения каналов были скорректированы неправильно, и мне нужно вытащить источник / средний / кампании за последние 12 месяцев (избегая выборки) и использовать панд для правильной классификации каналов для создания отчетов.
Заранее спасибо за помощь!