Расхождения между количеством сессий - PullRequest
0 голосов
/ 18 марта 2019

Я новичок в области Google Analytics / Big Query. Я пытаюсь понять, как считать сеансы в Big Query, но не могу понять, какие данные я получаю.

Как я понимаю,

  1. Каждая строка в BQ = один сеанс
  2. Идентификатор сеанса в BQ = visitId + fullvisitorId
  3. В некоторых случаях сеансы Google Analytics ниже, чем сеансы Big Query, поскольку GA автоматически отфильтровывает сеансы без событий взаимодействия

Дело в том, что когда я запускаю запрос с таким пониманием, это происходит:

  • сеансов в GA = 7.763.228 сеансов
  • Сеансы в BQ с отдельным посещением + fullvisitorId = 7.750.579 (ниже, чем GA, что показывает, что понимание № 3 не соответствует действительности)
  • Сеансы в сумме BQ totalals.visits = 7,763.228 (аналогично GA)
  • Количество строк = 7,763,592 (поскольку включает 364 сеанса с посещениями = NaN)

Я хочу знать, каким данным я могу доверять больше всего, и каков реальный уникальный идентификатор для каждого сеанса (поскольку числа не равны).

Кроме того, я заметил, что visitId + fullvisitorId не дает мне уникальный идентификатор сеанса, так как у меня есть 13.013 дубликатов visitId + fullvisitorId среди данных. У кого-нибудь есть идея или объяснение?

Заранее спасибо.

1 Ответ

0 голосов
/ 19 марта 2019

В сеансах Google Analytics перерывы выполняются каждый день в полночь, поэтому у вас нет пересекающихся сеансов. В этих случаях поле visitId, которое является просто отметкой времени, указывающей, когда начался пользовательский сеанс, все еще имеет то же значение из первого сеанса. Таким образом, вы можете иметь два сеанса с одной и той же комбинацией fullVisitorId + visitId, если она пересекает полночный лимит.

Если вам нужен уникальный идентификатор, который соответствует данным из Google Analytics, вы должны использовать visitStartTime + fullVisitorId. visitStartTime работает так же, как и visitId, но устанавливается снова, если сеанс прерывается в полночь. Вам также необходимо отфильтровать строки, в которых totalals.visits отличается от 1, как вы уже указали.

К сожалению, я не знаю ни одного официального ресурса, который бы указывал на это различие, но и обсуждения в сообществе, и тестирование подтверждают это.

...