У меня есть таблица, в которую я передаю несколько тысяч событий в час.Каждое событие имеет поле время , содержащее метку времени события, и таблица разбита по дням на поле время .
Я хочу рассчитать почасовоагрегировать статистику по данным, один раз в час.
Если я сделаю это только с разделами, это будет не очень эффективно, потому что для каждого почасового запроса я буду сканировать весь раздел (поэтому яПришлось бы сканировать все данные, которые до сих пор транслировались в течение дня, хотя я хочу только последний час).Поэтому я рассматриваю возможность кластеризации в час.
Я сомневаюсь: что в целом более эффективно?(1) кластеризовать поле time напрямую?или (2) иметь дополнительное поле час , содержащее время, округленное до часа, и кластеризовать это новое поле?