потоковая передача hadoop для файла python: зачем указывать один и тот же параметр командной строки дважды? - PullRequest
0 голосов
/ 01 сентября 2018

Например, у меня есть mapper.py и reducer.py, я могу запустить его так:

hadoop jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-2.8.4.jar \ 
-file ./mapper.py -mapper ./mapper.py \
-file ./reducer.py -reducer ./reducer.py \ 
-input war-and-peace-input/war-and-peace.txt \
-output war-and-peace-output-20

Нет проблем. Мой вопрос заключается в том, почему я должен указать параметры '-mapper' и '-file' для одного и того же mapper.py, '-reducer' и '-file' для одного и того же reducer.py. Зачем нужно указывать оба параметра /

...