Несмотря на увеличение значений переменных, которые изменяют уровни параллелизма Airflow, я никогда не получаю более девяти пакетов одновременно.
У меня есть кластер EKS с двумя узлами m4.large, вместимостью на 20 модулей каждый. Вся система занимает 15 модулей, поэтому у меня есть место, чтобы иметь еще 25 модулей, но они никогда не превышают девяти. Я создал политику эскалации, потому что планировщик немного напрягается, одновременно выбрасывая 500 дагов, но EKS создает дополнительный кластер, который все, что он делает, это распределяет девять пакетов. Я также провел тестирование с двумя узлами m4.2xlarge, с вместимостью почти в 120 модулей и с тем же результатом, несмотря на умножение на 4 производительности системы и увеличение количества потоков с 2 до 6.
Это значения переменных среды, которые я обрабатываю.
AIRFLOW__CORE__PARALLELISM = 1000
AIRFLOW__CORE__NON_POOLED_TASK_SLOT_COUNT = 1000
AIRFLOW__CORE__DAG_CONCURRENCY = 1000
AIRFLOW__CORE__SQL_ALCHEMY_POOL_SIZE = 0
AIRFLOW__CORE__SQL_ALCHEMY_MAX_OVERFLOW = -1
Что может происходить?