Выходные файлы по умолчанию называются part-x-yyyyy
где:
1) x
- это либо ‘m’
, либо ‘r
', в зависимости от того, было ли задание map only, или сокращение
2) yyyyy
является Mapper, или Reducer номер задачи (на основе нуля (00000
))
Таким образом, если задание имеет 10 редукторов, сгенерированные файлы будут иметь имена с part-r-0000
0 до part-r-0000
9, по одному для каждой задачи редуктора.
Можно изменить имя по умолчанию.
Это все, что вам нужно сделать в классе Driver, чтобы изменить значение по умолчанию для выходного файла:
job.getConfiguration().set(“mapreduce.output.basename”, “Neo”)
;
Таким образом, ваши файлы будут называться “Neo-r-00000”
.