В сеансах Google Analytics перерывы выполняются каждый день в полночь, поэтому у вас нет пересекающихся сеансов. В этих случаях поле visitId, которое является просто отметкой времени, указывающей, когда начался пользовательский сеанс, все еще имеет то же значение из первого сеанса. Таким образом, вы можете иметь два сеанса с одной и той же комбинацией fullVisitorId + visitId, если она пересекает полночный лимит.
Если вам нужен уникальный идентификатор, который соответствует данным из Google Analytics, вы должны использовать visitStartTime + fullVisitorId. visitStartTime работает так же, как и visitId, но устанавливается снова, если сеанс прерывается в полночь. Вам также необходимо отфильтровать строки, в которых totalals.visits отличается от 1, как вы уже указали.
К сожалению, я не знаю ни одного официального ресурса, который бы указывал на это различие, но и обсуждения в сообществе, и тестирование подтверждают это.