Понимание предустановки планирования «Нет» в Airflow - PullRequest
1 голос
/ 03 ноября 2019

Я начинаю работать с Apache Airflow и пытаюсь настроить управляемую событиями группу доступности базы данных в Airflow. Мое событие - это файл, помещаемый в каталог Linux. Этот файл может быть загружен несколько раз в течение дня. Я использую оператор File Sensor для мониторинга файлов.

Мое требование - каждый раз, когда файл попадает (с тем же именем) в каталог, который должен запустить Dag.

Я читал официальную документацию по планированию и, исходя из своего понимания, вижу с опцией Нет Я могу сделать так, чтобы мой Dag запускался извне на основе события, и он может вызываться несколько раз в течениедень на основе этого внешнего события.

Правильно ли мое понимание? Официальная документация не содержит подробной информации.

https://airflow.apache.org/scheduler.html?highlight=scheduling

1 Ответ

2 голосов
/ 04 ноября 2019

Это правильно. Если значение schedule_interval равно None, это означает, что Airflow никогда не будет автоматически планировать запуск Dag.

Вы можете планировать dag_runs внешне несколькими различными способами:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...