Мы планируем использовать Athena в качестве серверной службы для наших данных (хранящихся в виде паркетных файлов в разделах) в S3.
Некоторые вещи, которые нам интересно узнать, это то, как добавляются дополнительные столбцы в Предложение where запроса влияет на время выполнения запроса. Например, у нас есть 10 миллионов записей в одном разделе улья (раздел на основе столбца date)
И все запросы ниже возвращают тот же объем - 10 миллионов. будут ли все эти запросы выполняться одинаково или это сокращает выполнение запроса, когда мы добавляем дополнительные столбцы в предложение where (поскольку parquet является столбцовым fomar)? Я попытался проверить это, но результаты не были согласованными, так как было некоторое время в очереди, я думаю
select * from table where date='20200712'
select * from table where date='20200712' and type='XXX'
select * from table where date='20200712' and type='XXX' and subtype='YYY'