Я запускаю MapReduce от имени пользователя hdfs, и он выполняется успешно. Единственное, что я получил 15
part-r-000 ** файлов, из которых только 2 содержат некоторые результаты (эти 2 файла содержат всерезультат, который необходим, но 13 файлов имеют размер 0 байт).Так почему эти файлы генерируются?А также, поскольку два файла
part-r-00011 и
part-r-00012 достаточно малы, мы хотим, чтобы все результаты были в одном файле.
InCloudera, когда мы запускали одно и то же, мы получили только один файл с одинаковыми результатами.
Итак, как нам этого добиться?
Я знаком с командой getMerge - но это не должно бытьразрешение этого случая, потому что несколько частей - ***** файлов размером 0 байт не должны создаваться вообще.
Спасибо