Репликация Google Analytics всех сеансов для пользовательского измерения в BigQuery - PullRequest
0 голосов
/ 26 марта 2019

Я пытаюсь реплицировать сеансы по пользовательскому измерению в BigQuery в Google Analytics AII.У меня всего несколько сессий, и я не могу понять, как получить точное совпадение.

В настоящее время я понимаю, что GA прерывает сеансы в полночь (потому что его модель данных основана на обработке дневных блоков).Я устал принимать это во внимание приведенным ниже кодом, но что-то не совсем правильно.Кто-нибудь знает, как получить точное совпадение?

SELECT
  CD12,
  SUM(sessions) AS sessions
FROM (
   SELECT
   CD12,
   CASE WHEN hitNumber = first_hit THEN visits ELSE 0 END AS sessions
   FROM (
        SELECT
            fullVisitorId,
            visitStartTime,
            totals.visits,
            hits.hitNumber,
            CASE WHEN cd.index = 12 THEN cd.value END AS CD12,
            MIN(hits.hitNumber) OVER (PARTITION BY fullVisitorId, visitStartTime) AS first_hit
         FROM `data-....`,
            UNNEST(hits) AS hits,
            UNNEST(hits.customDimensions) AS cd
        )
    )
WHERE CD12 ='0'
GROUP BY 
CD12
ORDER BY
  sessions DESC
...