Как создать dag внутри другого потока воздуха dag apache - PullRequest
1 голос
/ 24 марта 2020

Я пытаюсь получить мастер-даг, который будет создавать дальнейшие даги в зависимости от моих потребностей. У меня есть следующий python файл внутри dags_folder в airflow.cfg . Этот код создает мастер-даг в базе данных. Этот мастер-даг должен читать текстовый файл и создавать даги для каждой строки в текстовом файле. Но даги, созданные внутри главного даг, не добавляются в базу данных. Как правильно его создать?

Информация о версии:

Python версия: 3.7

Apache - версия потока: 1.10.8

import datetime as dt

from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from airflow.operators.python_operator import PythonOperator

root_dir = "/home/user/TestSpace/airflow_check/res"

print("\n\n ===> \n Dag generator")

default_args = {
    'owner': 'airflow',
    'start_date': dt.datetime(2020, 3, 22, 00, 00, 00),
    'concurrency': 1,
    'retries': 0
}


def greet(_name):
    message = "Greetings {} at UTC: {} Local: {}\n".format(_name, dt.datetime.utcnow(), dt.datetime.now())
    f = open("{}/greetings.txt".format(root_dir), "a+")
    print("\n\n =====> {}\n\n".format(message))
    f.write(message)
    f.close()


def create_dag(dag_name):
    with DAG(dag_name, default_args=default_args,
             schedule_interval='*/2 * * * *',
             catchup=False
             ) as i_dag:
        i_opr_greet = PythonOperator(task_id='greet', python_callable=greet,
                                     op_args=["{}_{}".format("greet", dag_name)])
        i_echo_op = BashOperator(task_id='echo', bash_command='echo `date`')

        i_opr_greet >> i_echo_op
    return i_dag


def create_all_dags():
    all_lines = []
    f = open("{}/../dag_names.txt".format(root_dir), "r")
    for x in f:
        all_lines.append(str(x))
    f.close()

    for line in all_lines:
        print("Dag creation for {}".format(line))
        globals()[line] = create_dag(line)


with DAG('master_dag', default_args=default_args,
         schedule_interval='*/1 * * * *',
         catchup=False
         ) as dag:
    echo_op = BashOperator(task_id='echo', bash_command='echo `date`')
    create_op = PythonOperator(task_id='create_dag', python_callable=create_all_dags)
    echo_op >> create_op

Ответы [ 2 ]

3 голосов
/ 24 марта 2020

У вас есть 2 варианта:

  1. Использовать SubDagOperator : Пример DAG . Используйте его, если ваш интервал расписания может быть таким же.
  2. Запись Python файла DAG : Из вашего основного DAG создайте Python файлы в вашем AIRFLOW_HOME, содержащие DAG. Для этого вы можете использовать шаблонизатор Jinja2.
1 голос
/ 24 марта 2020
...