Athena - это многопользовательская распределенная система, и вы увидите много различий во времени запросов в зависимости от времени суток, учетной записи, в которой вы выполняете запросы, региона и т. Д.Некоторые запросы могут быть поставлены в очередь, и размер результирующего набора также влияет на общую продолжительность запроса.
Я предлагаю вам сравнить одни и те же запросы в разное время дня и всегда выполнятьпротив тех же данных.Измерьте продолжительность на клиенте, а также запишите время отправки, время завершения и время выполнения механизма из вызова API GetQueryExecution
.Когда вы запускаете запрос в консоли Athena, он сообщает о времени выполнения механизма, но это не включает в себя очереди и время, необходимое для чтения результатов в вашем клиенте (GetQueryResults
может быть очень медленным для больших наборов результатов).
Также запишите объем отсканированных данных, это важное число, которое нужно учитывать при тестировании разбиения и сегментирования, поскольку оно может сказать вам, использует ли запрос их или нет.