Можно ли ограничить количество картографов, выполняемых для задания, в любой момент времени с использованием потоковой передачи Hadoop?Например, у меня есть кластер из 28 узлов, который может выполнять 1 задачу на узел.Если у меня есть работа с 100 задачами, я бы хотел использовать, скажем, 20 из 28 узлов в любой момент времени.Я бы хотел ограничить некоторые задания, потому что они могут содержать много долго выполняющихся задач, и я иногда хочу запускать некоторые быстрее выполняемые задания и быть уверенным, что они могут выполняться немедленно, а не ждать завершения долго выполняющегося задания.
Я видел этот вопрос, и его заголовок точен, но ответы, похоже, не касаются этой конкретной проблемы.
Спасибо!