API Google Analytics Core Reporting, выборка и выгрузка - PullRequest
0 голосов
/ 20 марта 2020

Я пытаюсь написать коннектор Google Analytics в лямбда-функции, используя python, чтобы получить и сохранить все значения метрик и измерений, которые предоставляет API-интерфейс Google Core Reporting. На данный момент я могу запрашивать отдельные значения метрик / измерений из API, но не знаю, как вывести все данные как json, поскольку он возвращает только те значения, которые я запрашиваю.

"""Hello Analytics Reporting API V4."""

import argparse

from apiclient.discovery import build
import httplib2
from oauth2client import client
from oauth2client import file
from oauth2client import tools

SCOPES = ['https://www.googleapis.com/auth/analytics.readonly']
CLIENT_SECRETS_PATH = 'client_secrets.json' # Path to client_secrets.json file.
VIEW_ID = 'xxxxxxx'


def initialize_analyticsreporting():
  """Initializes the analyticsreporting service object.

  Returns:
    analytics an authorized analyticsreporting service object.
  """
  # Parse command-line arguments.
  parser = argparse.ArgumentParser(
      formatter_class=argparse.RawDescriptionHelpFormatter,
      parents=[tools.argparser])
  flags = parser.parse_args([])

  # Set up a Flow object to be used if we need to authenticate.
  flow = client.flow_from_clientsecrets(
      CLIENT_SECRETS_PATH, scope=SCOPES,
      message=tools.message_if_missing(CLIENT_SECRETS_PATH))

  # Prepare credentials, and authorize HTTP object with them.
  # If the credentials don't exist or are invalid run through the native client
  # flow. The Storage object will ensure that if successful the good
  # credentials will get written back to a file.
  storage = file.Storage('analyticsreporting.dat')
  credentials = storage.get()
  if credentials is None or credentials.invalid:
    credentials = tools.run_flow(flow, storage, flags)
  http = credentials.authorize(http=httplib2.Http())

  # Build the service object.
  analytics = build('analyticsreporting', 'v4', http=http)

  return analytics

def get_report(analytics):
  # Use the Analytics Service Object to query the Analytics Reporting API V4.
  return analytics.reports().batchGet(
      body={
        "reportRequests": [
        {
          "viewId": VIEW_ID,
          "metrics": []

        }]
      }
  ).execute()


def print_response(response):
  """Parses and prints the Analytics Reporting API V4 response"""

  for report in response.get('reports', []):
    columnHeader = report.get('columnHeader', {})
    dimensionHeaders = columnHeader.get('dimensions', [])
    metricHeaders = columnHeader.get('metricHeader', {}).get('metricHeaderEntries', [])
    rows = report.get('data', {}).get('rows', [])

    for row in rows:
      dimensions = row.get('dimensions', [])
      dateRangeValues = row.get('metrics', [])

      for header, dimension in zip(dimensionHeaders, dimensions):
        print (header + ': ' + dimension)

      for i, values in enumerate(dateRangeValues):
        print ('Date range (' + str(i) + ')')
        for metricHeader, value in zip(metricHeaders, values.get('values')):
          print (metricHeader.get('name') + ': ' + value)


def main():

  analytics = initialize_analyticsreporting()
  response = get_report(analytics)
  print_response(response)

if __name__ == '__main__':
  main()

Существующий фрагмент кода для извлечения данных и текущего вывода, который он производит

Date range (0)
ga:visits: 6

Вместо этого я пытаюсь получить все 500+ метрик, которые предоставляет Google Analytics.

1 Ответ

0 голосов
/ 23 марта 2020

На данный момент я могу запрашивать отдельные значения метрик / измерений из API , но не знаю, как вывести все данные как json, поскольку он возвращает только те значения, которые я запрашиваю. для .

Да, именно так работает API: вам нужно запросить конкретные c измерения и метрики, и вы получите только то, что просили.

Я пытаюсь получить все 500+ метрик, которые предоставляет Google Analytics.

Из коробки вы не можете : ограничения GA API Вы можете запросить 7 измерений + 10 показателей за раз (см. ниже документацию v3, то же самое относится и к v4):

https://developers.google.com/analytics/devguides/reporting/core/v3/reference#largeDataResults
", что позволяет максимум 7 измерений и 10 метрики в любом одном запросе API "

Обходной путь должен использовать пользовательское измерение , такое как идентификатор пользователя + идентификатор сеанса, с помощью которого вы можете уникально идентифицировать каждый сеанс, и, таким образом, выполнять несколько запросов API к собрать несколько измерений / метрик для каждого, а затем повторно объединить данные. * 1 027 *

Вот библиотека, которая объясняет более подробно:
https://github.com/aiqui/ga-download

...