Почему Даг бежит больше, когда Дагрунс в Потоке Воздуха? - PullRequest
0 голосов
/ 21 сентября 2018

Это мой код:

default_args = {
    'owner': 'airflow',
    'depends_on_past': True,
    'start_date': datetime(2018,9,9),
    'email': ['airflow@example.com'],
    'email_on_failure': False,
    'email_on_retry': False,
    'retries': 1,
    'retry_delay': timedelta(minutes=5)
}

dag = DAG('hello', catchup=False, default_args=default_args, schedule_interval=timedelta(minutes=1))

А список экземпляров задачи выглядит следующим образом: enter image description here

Вы видите, что я начал в 08:36:24, и я знаю, что это выполнит задачу в 08:35:20, так как я установил schedule_interval равным 1 минуте.Но почему он выполнил задание в 08:34:20?

1 Ответ

0 голосов
/ 05 октября 2018

Крайний правый столбец показывает, когда соответствующая задача была фактически выполнена, но не сообщает нам, когда вы фактически включили группу обеспечения доступности баз данных.Я подозреваю, что вы включили DAG, когда это было 08:35, планировщик поднял DAG и запланировал первый запуск DAG на 8:34.Поскольку планировщик завершил всю работу по настройке и выполнил первый прогон DAG, он уже был 8: 36.

Один минутный интервал был просто слишком коротким (или вы были слишком медленными;)).Попробуйте 10-минутный интервал и включите группу доступности баз данных, например, в 8:33 (т.е. не на границе интервала планирования, например 8:30 или 8:40), и вы увидите, что все работает так, как вы ожидаете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...