Не существует оптимального числа, но большинство параллельных рабочих, которых вы можете иметь приблизительно, можно рассчитать следующим образом.
Каждый NodeManager имеет 53248 МБ, умножьте это на количество подчиненных узлов
Вычтите из этого значения только одну am.resource.mb
, поскольку для всех заданий требуется мастер приложения.
Затем разделите это на большее из памяти вашего картографа или редуктора для общего числа задач MapReduce, которые могут выполняться одновременно