Есть ли способ установить коэффициент репликации для вывода конкретного задания MapReduce, отличающийся от остальной части кластера (скажем, 1)? Мне бы хотелось, чтобы мой основной набор данных был 3х репликами (как сейчас), но вывод некоторых моих заданий быстро перемещается из кластера и в конечном итоге отбрасывается, поэтому репликация не требуется, и я мог бы использовать пространство .
Я мог бы использовать setrep , но я думаю, что я могу сделать это только после факта.