Вы, безусловно, можете объединить несколько этапов карты, используя класс ChainMapper
Вы также можете установить зависимости между заданиями, используя класс JobControl и метод addDependingJob ().Это может быть предпочтительнее, чем запуск заданий Map Reduce из других заданий Map Reduce, что противоречит основному подходу Map Reduce, поскольку это, скорее всего, приведет к тому, что ваше решение больше не будет устойчивым к аппаратному отказу на отдельном узле.
Глава 5 Hadoop в действии Чака Лэма имеет хороший обзор этого.