в настоящее время я использую улей с хранилищем s3.
У меня сейчас 1000000 разделов. Я столкнулся с проблемой, когда:
Если я это сделаю:
Время выполнения запроса составляет менее 1 секунды.
select sum(metric) from foo where pt_partition_number = 'bar1'
select sum(metric) from foo where pt_partition_number = 'bar2'
Но если я сделаю
select sum(metric) from foo where pt_partition_number IN ('bar1','bar2')
Запрос занимает около 30 секунд. Я думаю, что улей делает сканирование каталогов в случае второго запроса.
Есть ли способ оптимизировать запрос:
Мой шаблон запроса всегда имеет доступ к двум данным раздела.