Я реализовал простой проект MapReduce в Hadoop для обработки журналов. Входной путь - это каталог, в котором находятся журналы.
Это работает нормально, но я хотел бы знать, как обрабатывается входной путь журнала в любое время в классе, который реализует Mapper. Код Mapper:
public class StatsMapper extends MapReduceBase implements Mapper<WritableComparable<Text>,Text,Text,Text> {
public static final Log LOG = LogFactory.getLog(StatsMapper.class);
public void configure(JobConf conf) {}
public void map(WritableComparable<Text> key, Text value, OutputCollector<Text,Text> output, Reporter reporter)
throws IOException {
process(key,value);
}
}
Есть идеи?
Заранее спасибо