Hadoop может быть настроен с несколькими планировщиками, и по умолчанию используется планировщик FIFO.
Расписание FIFO ведет себя следующим образом.
Сценарий 1: Если в кластере 10 мощностей Map Map, и для job1 требуется 15 Map Task, то выполнение job1 занимает весь кластер.По мере выполнения задания 1 и наличия свободных слотов, которые не используются заданием 1, в кластере запускается задание 2.
Сценарий 2: если в кластере 10 мощностей сопоставления задач, а для задания 1 требуется 6 сопоставлений, то задание 1 занимает6 слотов и job2 занимает 4 слота.job1 и job2 выполняются параллельно.
Для параллельного запуска заданий с самого начала вы можете настроить Fair Scheduler или Capacity Scheduler в соответствии с вашими требованиями.Mapreduce.jobtracker.taskscheduler и конкретные параметры планировщика должны быть установлены для того, чтобы это вступило в силу в mapred-site.xml .
Редактировать: обновлен ответ на основе комментария отMRK.