Любой из указанных вами вариантов будет работать:
- Переменная воздушного потока
- БД метаданных
A третий вариант будет сетевым хранилищем.
Если вы используете распределенный поток воздуха, возможно, вы храните группы обеспечения доступности баз данных в сетевом хранилище и монтируете их в works / scheduler / webserver. В этом случае надежным выбором будет размещение файлового отчета в этом хранилище (и, возможно, отправка его по электронной почте и т. Д.).
Вы можете написать плагин , который будет работать с любым из этих 3, и он может отображать то, что было написано / отправлено, когда.
Переменные
Легко читать / писать , но немного небрежно, чтобы перезаписывать его каждый день IMO.
MetadataDB
Используйте SQLAlchemy для создания и чтения / записи таблиц, хранящих эту информацию.
Вы можете получить сеанс в БД метаданных воздушного потока, выполнив:
from airflow import settings
session = settings.Session()
Сетевое хранилище
В этом случае просто читайте / записывайте файлы в обычном режиме.