Я бы хотел использовать Airflow с Statsd и DataDog для мониторинга, если DAG занимает, например, вдвое больше времени, чем его предыдущее выполнение. Итак, мне нужен какой-то таймер реального времени для DAG (или operator
).
Мне известно, что Airflow поддерживает некоторые показатели . Однако, насколько я понимаю, все показатели связаны с завершенными заданиями / группами DAG, верно? Так что это не решение, потому что я хотел бы отслеживать работающие группы доступности баз данных.
Я также рассмотрел функции timeout_execution / SLA , но они не подходят для этот вариант использования
Я хотел бы получить уведомление о зависании некоторого DAG, но я не хочу его убивать.