Например, у меня есть mapper.py и reducer.py, я могу запустить его так:
hadoop jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-2.8.4.jar \
-file ./mapper.py -mapper ./mapper.py \
-file ./reducer.py -reducer ./reducer.py \
-input war-and-peace-input/war-and-peace.txt \
-output war-and-peace-output-20
Нет проблем. Мой вопрос заключается в том, почему я должен указать параметры '-mapper' и '-file' для одного и того же mapper.py, '-reducer' и '-file' для одного и того же reducer.py. Зачем нужно указывать оба параметра /