У меня есть программа mapreduce, работающая на Hadoop-2.9 с 1 ведущим и 5 ведомыми.В этой программе обработка каждой записи является одной задачей.Таким образом, каждая задача вычисляется одним картографом.
Вопрос :
Как реплицировать задачу, чтобы задача была вычислена двумя мапперами?Или каждое задание будет выполнено дважды.