Основная проблема в том, что программа запускает
Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://quickstart.cloudera:8020/user/davide/wordcount/input already exists
Команда, которую я запускаю для запуска задания, следующая:
hadoop jar wordcount.jar org.wordcount.WordCount /user/davide/wordcount/input /user/davide/wordcount/output
, что кажется правильным (выходной каталог не существует, как притворяется hadoop).
В файле java пути, кажется, установлены правильно:
FileInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
Я попробовал несколько решений, но не смог понять, в чем проблема.
Заранее спасибо.