При попытке оптимизировать работу Spark у меня возникают проблемы с пониманием задержки 3-4 с при запуске второго и 6-7 с третьего и четвертого исполнителей.
Это то, что я работа с:
Ниже приведен скриншот вкладки заданий в пользовательском интерфейсе Spark.
Работа делится на три этапа. Как видно, второй, третий и четвертый исполнители добавляются только на втором этапе.
Ниже приводится описание этапа 0.
И после выполнения этапа 1.
Как видно на рисунке выше, для запуска executor 2 (на том же рабочем месте, что и первый) требуется около 3 с. Исполнители 3 и 4 (на втором работнике) заняли еще больше времени, примерно 6 с.
Я попытался поиграться с переменной spark.locality.wait
: значения 0 с, 1 с, 1 мс. Но, похоже, что время запуска исполнителей не изменилось.
Есть ли какая-то другая причина этой задержки? Где еще можно посмотреть, чтобы лучше это понять?