Если ваш источник s3, вам даже не нужно запускать задание Glue каждый час, чтобы определить, есть ли какие-либо загрузки / изменения в файлах в исходной корзине s3.
Вы можете использовать лямбда-триггер s3 который фактически запустит вашу работу Glue, если есть какая-либо загрузка на s3. Как только лямбда сработает, вы сможете запустить вашу работу с клеем. Ознакомьтесь с этим видео, чтобы узнать больше.
Таким образом, вы можете запускать свое задание Glue только тогда, когда вместо этого происходит загрузка каждый час.
Если вы все еще хотите запустить свое Склеивать задания каждый час, после чего вы можете использовать Склеивание с закладками , которые обрабатывают только самые последние данные при каждом запуске.