Я испытал это и раньше.Я полагаю, что это вызвано HTTP-запросом, выполнение которого оружейным работником веб-сервера занимает больше времени, чем ожидалось.Например, если для дерева DAG задано высокое значение, например 365 DAG запускается для группы DAG с большим количеством задач, вы сможете последовательно воспроизвести это.
Можете ли вы попытаться увеличить параметры тайм-аутана веб-сервере, чтобы увидеть, если это имеет значение?
- Сначала попробуйте увеличить
web_server_worker_timeout
(по умолчанию = 120 секунд) в группе [webserver]
. - Если это не такЧтобы решить эту проблему, вы также можете попытаться увеличить
web_server_master_timeout
в той же группе. - Еще один способ - переключить веб-сервер
worker_class
(по умолчанию = sync
) на eventlet
или gevent
.
Ссылка: https://github.com/apache/incubator-airflow/blob/c27098b8d31fee7177f37108a6c2fb7c7ad37170/airflow/config_templates/default_airflow.cfg#L225-L229
Обратите внимание, что альтернативные рабочие классы требуют установки Airflow с такими дополнительными элементами async
, как:
pip install apache-airflow[async]
. Вы можете найти большеинформация о тайм-аутах рабочих-оружейников в этом вопросе: Как устранить ошибку критического тайм-аута рабочих-оружейников? .