Первое задание моего DAG имеет depends_on_past=True
и wait_for_downstream=True
. DAG запускался автоматически, когда я включил его On
, и он успешно завершился Теперь я снова вызвал группу DAG (после успешного первого запуска), но на этот раз моя первая задача не запустилась. Task Instance Details
для этой задачи показывает depends_on_past is true for this task's DAG, but the previous task instance has not run yet.
Согласно документам о depends_on_past (boolean)
:
при значении True препятствует запуску задачи если предыдущее расписание для задачи не удалось.
Первый запуск группы обеспечения доступности баз данных прошел успешно, а первый экземпляр первой задачи (очевидно) также был (очевидно) успешным. Тем не менее, почему второй экземпляр первой задачи жалуется, что previous task instance has not run yet
?
Соответствующие части моего кода:
...
args = {
'owner': 'USC Graduate School',
'start_date': days_ago(1),
}
dag = DAG(
dag_id='enrollment_import_poc',
default_args=args,
schedule_interval='0 0 * * *',
dagrun_timeout=timedelta(minutes=60),
max_active_runs=1,
template_searchpath = os.environ.get('AIRFLOW_HOME'),
tags=['uscgradschool']
)
schools = MsSqlOperator(
task_id='schools',
depends_on_past=True,
wait_for_downstream=True,
sql=os.path.join("queries", "01_schools.sql"),
mssql_conn_id="mssql_local",
autocommit=True,
dag=dag
)
...