В настоящее время я работаю с Airflow и Celery для обработки файлов.Работник должен загрузить файлы, обработать их и повторно загрузить их после.Мои DAGs хороши только с одним работником.Но когда я добавляю одну вещь усложняется.
Рабочие выполняют задачи так, как они доступны.Worker1 может взять на себя задачу «обработка загруженных файлов», но это был Worker2, который взял задачу «загрузка файлов», поэтому задача не удалась, потому что он не может обрабатывать файлы, которые не существуют.
Есть лиспособ указать работникам (или планировщику), что группа обеспечения доступности баз данных должна запускаться только на одном работнике?Я знаю об очереди.Но я уже использую их.