Я ищу менеджер ресурсов с открытым исходным кодом, который может управлять крупномасштабными рабочими процессами в распределенной вычислительной среде.Я провел опрос TORQUE, SLURM, LOADLEVELER, SLURM лучше, чем TORQUE, для обработки больших узлов, но в одном кластере.Все они используются для периодических систем.Кондор используется для сеточных сред, но обеспечивает крупнозернистую распределенную пареллизацию.Я чувствую, что Ganglia и Nagios хороши в средах высокопроизводительных вычислений.Но я хочу знать, можно ли использовать Ganglia и Nagios для рабочих процессов?Может ли мой алгоритм планирования встроен в планировщик и использовать его с Resource Manager через Hadoop MapReduce Framework?Полезные ответы более ценны.Спасибо.