Бесполезная ошибка потокового файла Hadoop не найдена - PullRequest
0 голосов
/ 05 ноября 2018

Я пытаюсь запустить задание MapReduce с использованием потоковой передачи Hadoop, следуя этому руководству. Когда я пытаюсь запустить его, я получаю следующую ошибку

2018-11-05 22:49:31,093 INFO impl.MetricsConfig: loaded properties from hadoop-metrics2.properties
2018-11-05 22:49:31,170 INFO impl.MetricsSystemImpl: Scheduled Metric snapshot period at 10 second(s).
2018-11-05 22:49:31,170 INFO impl.MetricsSystemImpl: JobTracker metrics system started
2018-11-05 22:49:31,184 WARN impl.MetricsSystemImpl: JobTracker metrics system already initialized!
2018-11-05 22:49:31,365 INFO mapreduce.JobSubmitter: Cleaning up the staging area file:/tmp/hadoop/mapred/staging/hduser1541912163/.staging/job_local1541912163_0001
2018-11-05 22:49:31,366 ERROR streaming.StreamJob: Error Launching job : No such file or directory
Streaming Command Failed!

Как видите, ошибка не очень полезна, потому что она не сообщает , какой файл не был найден.

Используемая мной команда:

/ usr / local / hadoop / bin / hadoop jar /usr/local/hadoop/share/hadoop/tools/lib/hadoop-streaming-3.1.1.jar -mapper "/ home / hduser / emotion_test / mapper. py "-reducer" /home/hduser/emotion_test/reducer.py "-input / emotion_doc -output / emotion_output

Я тоже пытался обратиться к этому вопросу, но это не помогло.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...