При обработке HDFS после каждого задания создаются пустые файлы с именами, такими как part-m-0000 *.Каждый из этих файлов пуст, но они занимают 64 МБ дискового пространства, потому что это размер блока по умолчанию.
Необходимо внести изменения в код, чтобы пропустить создание этих файлов.Как мне это сделать?
Примечание: я использую org.apache.hadoop.mapreduce.lib.output.MultipleOutputs<KEYOUT,VALUEOUT>
для записи выходных записей, а не Context, поэтому я в любом случае получаю выходные записи в файлах типа «success-m-00000» и т. Д.1006 *