Horton Works - после запуска MapReduce несколько файлов part-r-000 ** с 0 байтами - PullRequest
0 голосов
/ 29 января 2019

Я запускаю MapReduce от имени пользователя hdfs, и он выполняется успешно. Единственное, что я получил 15

part-r-000 ** файлов, из которых только 2 содержат некоторые результаты (эти 2 файла содержат всерезультат, который необходим, но 13 файлов имеют размер 0 байт).Так почему эти файлы генерируются?А также, поскольку два файла

part-r-00011 и

part-r-00012 достаточно малы, мы хотим, чтобы все результаты были в одном файле.

InCloudera, когда мы запускали одно и то же, мы получили только один файл с одинаковыми результатами.

Итак, как нам этого добиться?

Я знаком с командой getMerge - но это не должно бытьразрешение этого случая, потому что несколько частей - ***** файлов размером 0 байт не должны создаваться вообще.

Спасибо

...