Google Analytics данные в реальном времени в BigQuery - PullRequest
0 голосов
/ 07 июня 2018

Мы включили непрерывный экспорт данных Google Analytics в BigQuery , что означает, что мы получаем ga_realtime_sessions_YYYYMMDD таблиц с дампами данных в течение дня.

Эти таблицы - обычно!- оставлено на месте, поэтому мы накапливаем стек таблиц реального времени за предыдущие n даты ( n не представляется настраиваемым).

Однако каждыйвремя от времени одна из таблиц исчезает, поэтому в последовательности дат будут пропуски, и у нас может не быть таблицы, например, вчера.

Документировано ли это поведение где-нибудь?

Было бы неплохо узнать, какие гарантии мы имеем, поскольку мы могли бы полагаться, например, на данные в реальном времени со вчерашнего дня, пока мы ожидаем появления «законченной» таблицы ga_sessions_YYYYMMDD.В документе поддержки, указанном выше, это не упоминается.

1 Ответ

0 голосов
/ 07 июня 2018

Как указано в этой справочной статье , эти внутренние таблицы ga_realtime_sessions_YYYYMMDD не следует использовать для запросов, а вместо них следует использовать представление ga_realtime_sessions_view_YYYYMMDD для получения свежих данных и во избежание непредвиденных результатов.,

В случае, если вы хотите использовать данные какого-то дня назад, пока вы ожидаете создания внутренних таблиц ga_realtime_sessions_YYYYMMDD на сегодняшний день, вы можете скопировать данные, полученные из запроса представления ga_realtime_sessions_view_YYYYMMDD, в отдельную таблицу.в конце дня для этой цели.

...