Я думаю, что для агрегации page_paths
на уровне cookie
лучше всего группировать по visitor_id
. visitor_id
- это то, что назначается GA как cookie
и должно сохраняться при посещениях, если пользователь не переходит в режим инкогнито или не удаляет файлы cookie. В зависимости от того, используете ли вы пользовательское измерение для отслеживания пользователей logging on
на вашем веб-сайте, вы увидите, что у пользователя может быть несколько visitor_id
с.
Перед объединением вы можете объединить всю эту информацию, используя visit_id
, чтобы различать различные сеансы. Вы можете запросить все данные уровня попадания для данного пользователя, а затем свернуть оттуда.
Я думаю, что это можно сделать, изменив предложение WHERE
в своем запросе на то, как вы запрашиваете уровень попадания сеанса сейчас, сохраняя hit number
, но теперь вы просматриваете все сеансы,
SELECT
fullVisitorId,
visitId,
visitNumber,
hits.hitNumber AS hitNumber,
hits.page.pagePath AS pagePath
FROM
TABLE_DATE_RANGE( [bigquery-public-data.google_analytics_sample.ga_sessions_],
TIMESTAMP('2017-07-01'), TIMESTAMP('2017-07-31') )
WHERE
hits.type="PAGE"
ORDER BY
fullVisitorId,
visitId,
visitNumber,
hitNumber