Я немного запутался в том, как настроить конфигурацию Spark для рабочих нагрузок, используя YARN в качестве менеджера ресурсов. У меня сейчас небольшой кластер с 1 главным узлом и 2 основными узлами.
Включить ли основной узел при подсчете количества исполнителей или нет?
Оставить ли 1 ядро для каждого узла для учета управления пряжей?
Должен ли я назначить мастер-узел для чего-либо, в частности, в конфигурациях Spark?