В моей базе данных о поведении пользователей на сайте есть следующая таблица.
+--------+-----------+------------------------+-----------+
| UserID | Timestamp | Behavior | WebsiteID |
+--------+-----------+------------------------+-----------+
| 123 | 1 | ENTER_SITE_FROM_VENDOR | 1 |
| 123 | 2 | CLICK_ABOUT | 1 |
| 123 | 3 | CLICK_JOBS | 1 |
| 456 | 1 | ENTER_SITE_FROM_SEARCH | 2 |
| 456 | 2 | CLICK_AD | 2 |
| 456 | 3 | CLICK_JOBS | 2 |
+--------+-----------+------------------------+-----------+
Для каждого пользователя есть идентификатор пользователя и отметка времени, когда произошел конкретный щелчок. Я пытаюсь ответить на несколько вопросов, связанных с поведением потока из этих данных. Например, я хочу знать, сколько раз человек заходит на наш сайт и нажимает на объявление. У меня есть несколько таких сценариев, которые описываются набором событий, происходящих в определенной последовательности. Я знаю, что в Google Analytics есть функциональные возможности для этого, но я не уверен, есть ли у кого-нибудь реализации Python для создания отчета по таким данным? Кроме того, существует несколько веб-сайтов.
Я знаю, что в Google Analytics есть инструмент потока пользователей: https://www.monsterinsights.com/how-to-conduct-a-user-flow-analysis-in-google-analytics/, но мне не разрешено его использовать. Желаемый результат будет примерно таким же, как показывает инструмент потока пользователей Google Analytics: общее количество людей, заходящих на сайт, из этих людей, сколько человек нажали на
Желаемый результат будет выглядеть примерно так:
| Website | clicked_about_first | clicked_jobs_after_ad | clicked_job_after_entering_from_search | clicked_ad_after_entering_from_vendor |
+---------+---------------------+-----------------------+----------------------------------------+---------------------------------------+
| 2 | 0 | 1 | 1 | 0 |
| 1 | 1 | 0 | 0 | 1 |
+---------+---------------------+-----------------------+----------------------------------------+---------------------------------------+