Анализ рыночной корзины пути Google Analytics в Python - PullRequest
0 голосов
/ 12 ноября 2019

Я хотел бы подготовить анализ корзины в Python на основе данных Google Analytics. Я хотел бы изучить, какие наиболее распространенные пути проходит пользователь, и на уровне файлов cookie. Я столкнулся с двумя проблемами: во-первых, когда я запрашиваю данные из BigQuery, число попаданий находится на уровне сеанса, а не на уровне файлов cookie. Как я могу показать путь, по которому прошел пользователь (в файле cookie, а не на уровне сеанса)? Во-вторых, я не знаю, как настроить данные: в R класс транзакций необходим для подготовки данных к алгоритму априори. Я знаю, что в Python решение заключается в одном «горячем» кодировании данных, однако моя проблема в том, что из-за этого решения теряется последовательность путей к страницам.

Может ли кто-нибудь помочь мне? Спасибо!

1 Ответ

0 голосов
/ 12 ноября 2019

Я думаю, что для агрегации page_paths на уровне cookie лучше всего группировать по visitor_id. visitor_id - это то, что назначается GA как cookie и должно сохраняться при посещениях, если пользователь не переходит в режим инкогнито или не удаляет файлы cookie. В зависимости от того, используете ли вы пользовательское измерение для отслеживания пользователей logging on на вашем веб-сайте, вы увидите, что у пользователя может быть несколько visitor_id с.

Перед объединением вы можете объединить всю эту информацию, используя visit_id, чтобы различать различные сеансы. Вы можете запросить все данные уровня попадания для данного пользователя, а затем свернуть оттуда.

Я думаю, что это можно сделать, изменив предложение WHERE в своем запросе на то, как вы запрашиваете уровень попадания сеанса сейчас, сохраняя hit number, но теперь вы просматриваете все сеансы,

SELECT
fullVisitorId,
visitId,
visitNumber,
hits.hitNumber AS hitNumber,
hits.page.pagePath AS pagePath
FROM
TABLE_DATE_RANGE( [bigquery-public-data.google_analytics_sample.ga_sessions_],
TIMESTAMP('2017-07-01'), TIMESTAMP('2017-07-31') )
WHERE
hits.type="PAGE"
ORDER BY
fullVisitorId,
visitId,
visitNumber,
hitNumber  
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...