Как сохранить вывод только непустых редукторов в HDFS - PullRequest
4 голосов
/ 26 мая 2011

В моем приложении редуктор сохраняет все файлы деталей в HDFS, но я хочу, чтобы только редуктор записывал файлы деталей, размеры которых не равны 0 байтам. Пожалуйста, дайте мне знать, как его определить.

Ответы [ 2 ]

6 голосов
/ 12 октября 2011

Возможно - см. Раздел документации "Ленивый вывод":

http://hadoop.apache.org/mapreduce/docs/current/mapred_tutorial.html#Lazy+Output+Creation

import org.apache.hadoop.mapreduce.lib.output.LazyOutputFormat;
LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class); 
0 голосов
/ 19 июня 2013

Если вы используете старый API, вы можете использовать класс NullOutputFormat:

import org.apache.hadoop.mapred.lib.NullOutputFormat;
conf.setOutputFormat(NullOutputFormat.class);
...