Найдите путь файла jar hadoop-streaming-1.2.1.jar в Google File Platform.
https://github.com/devangpatel01/TF-IDF-implementation-using-map-reduce-Hadoop-python-
Я пытаюсь запустить этот mapreduce на GCP, используя hadoop,но я не могу найти путь hadoop-streaming-1.2.1.jar. Я попытался загрузить файл JAR вручную и загрузить его в hadoop, а затем запустить mapper1.py. Но я получаю ошибку, говоря, что путь неверен. Вышеуказанная программа была запущена на локальной машине. Как мне отредактировать команду для ее запуска на GCP?
hadoop jar /home/kirthyodackal/hadoop-streaming-1.2.1.jar -input hdfs: // cluster-29-m / input_prgs / input_prgs /input1 / 000000_0-выход hdfs: // cluster-29-m / input_prgs / input_prgs / output1 -mapper hdfs: //cluster-29-m/input_prgs/input_prgs/mapper1.py -reducer hdfs: // cluster-29-m/input_prgs/input_prgs/reducer1.py