Вопросы, связанные с ядрами и исполнителями, задаются несколько раз в SO.
Apache Spark: количество ядер в сравнении с количеством исполнителей
Для каждогодело другое, я снова задаю похожий вопрос.
У меня запущено приложение с интенсивным использованием процессора с одинаковым количеством ядер с разными исполнителями.Ниже приведены наблюдения.
Диспетчер ресурсов: Kubernetes
Случай 1: Исполнителей - 6, Количество ядер для каждого исполнителя -2, ИсполнительПамять - 3g, Объем обработки данных ~ 10 ГБ, Разделы -36, Продолжительность работы: 75 минут
Случай 2: Исполнителей - 4, Количество ядер для каждогоexecutor -3, память исполнителя - 3g, объем обработки данных ~ 10 ГБ, разделы -36, продолжительность задания: 101 мин.
. По приведенной выше ссылке, менее 5 ядер на исполнителяхорошо для операций ввода-вывода.
В обоих моих случаях ядра одинаковы (12), однако оба задания занимали разное время.Есть мысли?
Обновлено
Случай 3: Исполнителей - 12, Количество ядер для каждого исполнителя -1, Память исполнителя - 3g, Количествообработки данных ~ 10 ГБ, разделы -36, длительность задания: 81 мин