Не удается сопоставить расширенный сегмент GA и результаты BigQuery - PullRequest
0 голосов
/ 15 ноября 2018

Я использую простой расширенный сегмент GA: enter image description here

И он возвращает 10,440 сеансов в интерфейсе GA за один день.

Когда я пытаюсьчтобы сделать нечто подобное в BigQuery с использованием стандартного SQL, я получаю разные результаты:

SELECT fullVisitorId, visitStartTime
FROM `project.id.ga_sessions_20181001`
where EXISTS(
  SELECT 1 FROM UNNEST(hits) h 
  WHERE h.type  = 'PAGE'
  AND REGEXP_CONTAINS(page.pagePath, r'/signup/.*'));

Это возвращает 10 137 сеансов за один день.И это:

SELECT fullVisitorId, visitStartTime
FROM `project.id.ga_sessions_20181001`
where EXISTS(
  SELECT 1 FROM UNNEST(hits) h 
  WHERE AND REGEXP_CONTAINS(page.pagePath, r'/signup/.*'));

Возвращает 10 564 сеанса за тот же день.Как заставить их соответствовать интерфейсу GA?

1 Ответ

0 голосов
/ 16 ноября 2018

Сеансы в качестве метрики в GA и BigQuery - это предварительно агрегированная метрика, позволяющая ускорить обработку. Чтобы соответствовать GA, вам нужно использовать SUM(totals.visits), а не COUNT(DISTINCT CONCAT(fullVisitorId,CAST(visitId as STRING))). Посещения вашего сайта, когда пользователь вызывает только события, не связанные с взаимодействием (и без просмотра страниц), приведут к посещению и записи в BigQuery со значением totals.visits, равным нулю, но могут запрашиваться и сообщаться об использовании сегментов для пользователей, или Уникальные комбинации размеров .

BigQuery Query View: enter image description here

Представление Google Analytics Dasboard:

enter image description here

...