Рабочие узлы Airflow не совпадают с узлами EMR.
В типичной настройке рабочий из сельдерея («Рабочий узел Airflow») считывает из очереди заданий и выполняет их, используя соответствующий оператор (Inэтот случай, вероятно, SparkSubmitOperator или, возможно, SSHOperator).
Рабочие Celery не будут работать на ваших узлах EMR, поскольку они предназначены для выполнения заданий Hadoop.
Рабочие Celery, скорее всего, будут работать на EC2 вне вашего кластера EMR.
OneРаспространенное решение, заключающееся в том, чтобы иметь одинаковые группы доступности базы данных на каждом работнике сельдерея, - это поместить эти ярлыки в сетевое хранилище (например, EFS) и подключить сетевой диск к EC2s работника сельдерея.