BigQuery кластеризация в час - PullRequest
       4

BigQuery кластеризация в час

0 голосов
/ 28 февраля 2019

У меня есть таблица, в которую я передаю несколько тысяч событий в час.Каждое событие имеет поле время , содержащее метку времени события, и таблица разбита по дням на поле время .

Я хочу рассчитать почасовоагрегировать статистику по данным, один раз в час.

Если я сделаю это только с разделами, это будет не очень эффективно, потому что для каждого почасового запроса я буду сканировать весь раздел (поэтому яПришлось бы сканировать все данные, которые до сих пор транслировались в течение дня, хотя я хочу только последний час).Поэтому я рассматриваю возможность кластеризации в час.

Я сомневаюсь: что в целом более эффективно?(1) кластеризовать поле time напрямую?или (2) иметь дополнительное поле час , содержащее время, округленное до часа, и кластеризовать это новое поле?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...