Я только начал с Airflow. Я хочу настроить группу обеспечения доступности баз данных в цикле, где следующая группа обеспечения доступности баз данных начинается, когда завершается предыдущая группа обеспечения доступности баз данных. Вот рабочий процесс, которого я хочу достичь:
list_of_files = [......]
for file in list_of_files:
dag = DAG('pipeline', default_args=default_args, schedule_interval=None)
t1 = BashOperator('copy_this_file', ....)
t2 = BashOperator('process_this_file', ...)
t1.set_downstream(t2)
Если я запускаю airflow backfill pipeline -s 2019-05-01
, все группы доступности баз данных запускаются одновременно.