Я зависим от номера сеанса событий, чтобы понять поведение пользователя, например, номер сеанса, в котором они удалили приложение, и другие вещи. После визуализации результатов выясняется, что есть большая часть событий, у которых просто нет идентификаторов и номеров сеансов.
Итак, я копал дальше и использовал запрос ниже, чтобы понять больше:
SELECT DISTINCT(event_name),
Count(*) AS `total_events`,
countif(seid IS NOT NULL) AS `non_null_ids`,
countif(seid IS NULL) AS `null_ids`,
round(100*(countif(seid IS NULL)/count(*)),2) AS `null_perc`
FROM (
SELECT event_name,
(
SELECT value.int_value
FROM unnest(event_params )
WHERE KEY = "ga_session_id" ) AS `seid`
FROM `table1.analytics.events_*`
WHERE (
_table_suffix BETWEEN '20200601' AND '20200715'))
GROUP BY event_name
ORDER BY `null_perc` DESC
Оказывается, большинство событий с нулевыми идентификаторами сеансов исходит от
os_notification_received 80% of events have null session ids
os_notification_opened 60% of events have null session ids
app_remove 20% of events have null session ids
Мой вопрос: есть ли что-то на моей стороне, что я могу сделать, чтобы уменьшить идентификаторы сеансов с нулевым значением?