У меня есть общий вопрос о AWS Glue и его сканерах. У меня есть несколько потоков данных в сегменты S3, и я использую AWS Athena для доступа к ним как к внешним таблицам в красном смещении.
Таблицы разделены по часам, некоторые сканеры клея обновляют разделы и структуру таблицы каждый час.
Проблема в том, что сканеры занимают все больше и больше времени, и когда-нибудь они не закончат менее чем за час.
Существуют ли какие-либо настройки для ускорения этого процесса или какая-то правильная альтернатива сканерам в AWS Glue?