Я использую различные сервисы AWS (Lambda, Glue, S3, Redshift, EC2) для обработки ETL. Я пытаюсь создать «поток ETL журнала», чтобы отслеживать и отправлять уведомления (по электронной почте или иным способом), когда в процессе происходит сбой шага.
Я проверил, что у каждой службы, которую я использую, есть метрики, зарегистрированные в CloudWatch. Сейчас я пытаюсь найти разумный способ обработки этих данных для отправки уведомлений в случае сбоя шага и / или централизованного мониторинга всего потока.
Существуют ли передовые практики или примерыэта настройка?