Google Analytics: извлечение данных в python, избегая выборки - PullRequest
0 голосов
/ 11 сентября 2018

В среднем на моем веб-сайте около 300 тыс. Сеансов в неделю, и Google Analytics начинает возвращать выборочные данные около 500 тыс. Сеансов. Это означает, что если я пытаюсь получить данные для чего-либо в течение недели, я получаю выборочные данные - я хочу избежать этого.

Мне нужна помощь, чтобы выяснить, как выполнять итерацию по большему диапазону дат (повторяется еженедельно / ежедневно) , чтобы я мог избежать выборки.

Для справки, я добавил код, который я использую для извлечения данных из моей учетной записи GA:

from google2pandas import *
import numpy as np
import pandas as pd
import time
import datetime

##-----------SETUP-----------##    

SCOPES = ['https://www.googleapis.com/auth/analytics.readonly']
KEY_FILE_LOCATION = 'client_secrets.json'
VIEW_ID = 'XXXXXXX'
START_DATE = '2018-01-01'
END_DATE = '2018-08-31'

##-----------PULLING IN DATA-----------##

query1 = {
    'reportRequests': [{
        'viewId' : VIEW_ID,
        'dateRanges' : [{'startDate': START_DATE,'endDate': END_DATE}],
        'dimensions' : [{'name': 'ga:date'}],
        'metrics'    : [{'expression': 'ga:sessions'}]
    }]
}

conn = GoogleAnalyticsQueryV4(secrets= KEY_FILE_LOCATION)
df = conn.execute_query(query1)


df.head()

Запрос упрощен, только для извлечения дат и сессий (чтобы упростить тестирование) , но, если кому-то интересен контекст, наши определения каналов были скорректированы неправильно, и мне нужно вытащить источник / средний / кампании за последние 12 месяцев (избегая выборки) и использовать панд для правильной классификации каналов для создания отчетов.

Заранее спасибо за помощь!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...