Каков полный список параметров потоковой командной строки, возможных для версии Hadoop YARN? - PullRequest
0 голосов
/ 04 февраля 2019

Я просматривал веб-сайт Hadoop и нашел следующую ссылку для потоковой передачи hadoop.

https://hadoop.apache.org/docs/current1/streaming.html

Но меня больше интересует Hadoop YARN (MRv2) - Потоковая командная строкаoptions.

Если у кого-то есть исчерпывающий список, не могли бы вы опубликовать его здесь?

Если он не найден, может кто-нибудь сказать мне, если какой-либо из параметров командной строки в следующей команденезаконны.

yarn jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-streaming.jar \
    -D mapred.jab.name="Streaming wordCount Rating" \
    -D mapreduce.job.output.key.comparator.class=org.apache.hadoop.mapreduce.lib.partition.KeyFieldBasedComparator \
    -D map.output.key.field.separator=\t \
    -D mapreduce.partition.keycomparator.options=-k2,2nr \
    -D mapreduce.job.reduces=${NUM_REDUCERS} \
    -files mapper2.py,reducer2.py \
    -mapper "python mapper2.py" \
    -reducer "python reducer2.py" \
    -input ${OUT_DIR} \
    -output ${OUT_DIR_2} > /dev/null

1 Ответ

0 голосов
/ 06 февраля 2019

Если вы хотите увидеть все параметры командной строки потоковой передачи Hadoop, обратитесь к StreamJob.java - setupOptions () :

    allOptions = new Options().
      addOption(input).
      addOption(output).
      addOption(mapper).
      addOption(combiner).
      addOption(reducer).
      addOption(file).
      addOption(dfs).
      addOption(additionalconfspec).
      addOption(inputformat).
      addOption(outputformat).
      addOption(partitioner).
      addOption(numReduceTasks).
      addOption(inputreader).
      addOption(mapDebug).
      addOption(reduceDebug).
      addOption(jobconf).
      addOption(cmdenv).
      addOption(cacheFile).
      addOption(cacheArchive).
      addOption(io).
      addOption(background).
      addOption(verbose).
      addOption(info).
      addOption(debug).
      addOption(help).
      addOption(lazyOutput);

Параметры, связанные с MapReduce, являются общими для всехПриложения MapReduce и чтобы узнать, являются ли они действительными, посмотрите переменные конфигурации mapred-default.xml .К вашему сведению: это относится к Hadoop 2.8.0, поэтому вам может потребоваться найти соответствующий XML для вашей версии Hadoop.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...