Я пытаюсь получить данные из внешнего API и сбросить их на S3. Я думал о том, чтобы написать и Airflow Operator rest-to-s3.py, который будет извлекать данные из внешнего API отдыха.
Мои опасения:
- Это будет долго задача, как отслеживать ошибки?
- Есть ли лучшая альтернатива, чем написание оператора?
- Желательно ли выполнить задачу, которая, вероятно, будет выполняться в течение нескольких часов и ждать на нем?
Я довольно новичок в Airflow, так что это было бы полезно.