Как запустить задание Hadoop в Java из терминала - PullRequest
0 голосов
/ 22 февраля 2019

Я новичок в Java и Hadoop.

Я пытаюсь запустить скрипт из командной строки и не совсем понимаю аргументы.Увидеть ниже.

 DistributedCache.addCacheFile((new Path(args[2])).toUri(), conf);
 DistributedCache.addCacheFile((new Path(args[3])).toUri(), conf);
 NLineInputFormat.addInputPath(job, new Path(args[0]));
 FileOutputFormat.setOutputPath(job, new Path (args[1]));

Я понимаю, что каждая из приведенных выше строк является аргументом.Я полагаю, что первый - это входной путь (где находятся данные, которые я читаю), а второй - выходной путь (где будет храниться окончательный результат?). Однако я не понимаю третьего и четвертого аргументов, касающихсяв DistributedCache.addCacheFile.Любое объяснение будет с благодарностью.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...