Оптимизировать запрос улья, запрашивая данные из двух разделов - PullRequest
0 голосов
/ 14 ноября 2018

в настоящее время я использую улей с хранилищем s3.

У меня сейчас 1000000 разделов. Я столкнулся с проблемой, когда:

Если я это сделаю:

Время выполнения запроса составляет менее 1 секунды.

select sum(metric) from foo where pt_partition_number = 'bar1'

select sum(metric) from foo where pt_partition_number = 'bar2'

Но если я сделаю

select sum(metric) from foo where pt_partition_number IN ('bar1','bar2')

Запрос занимает около 30 секунд. Я думаю, что улей делает сканирование каталогов в случае второго запроса.

Есть ли способ оптимизировать запрос: Мой шаблон запроса всегда имеет доступ к двум данным раздела.

...