Неожиданные графики Dag для catchup = false - PullRequest
0 голосов
/ 14 января 2019

Я изучаю основы Airflow (apache-airflow == 1.10.1, MacBook OSX) и не могу понять фактическое расписание, созданное для запуска dag.

Создан простой DAG с одним PythonOperator:

  • некоторые start_date в прошлом
  • schedule_interval: расписание каждые 10 минут
  • catchup Неверно, потому что я НЕ хочу какой-либо засыпки

Система приводит к следующим запускам dag (execute_date, / start_date)

  1. (2019-01-14 01: 57: 10.404054, 2019-01-14 02: 17: 10.410499)

  2. (2019-01-14 02: 07: 10.404054, 2019-01-14 02: 17: 12.226403)

  3. (2019-01-14 02: 17: 10.404054,2019-01-14 02: 27: 11.797695)

Учитывая, что я активировал расписание около 2019-01-14T02:17:10 (это сегодня UTC 14 января 19 @ 2:17:10), я ожидал, что система создаст расписание только в строке № 2. и 3, но не в этом. в строке # 1.?

Вот код:

default_args = {
    'owner': 'ga_mp', 'depends_on_past': False,
    'start_date': datetime(2019, 1, 10, 4, 20, 00),
}
dag = DAG(dag_id = 'my_dag_v1',
          default_args=default_args,
          schedule_interval=timedelta(minutes=10),
          catchup=False
       )

Большое спасибо!

1 Ответ

0 голосов
/ 14 января 2019

Я полагаю, что вновь созданный значок воздушного потока, следующий за расписанием, будет автоматически запускаться при его создании. Вы изначально создали даг в 1:57? Это может объяснить запуск строки 1.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...