Я установил Pydoop
и пытаюсь запустить MapReduce
задания. Просто для пробного запуска я попытался выполнить примеры подсчета слов wordcount_minimal.py
и wordcount_full.py
. Оба они висят на этапе карты. В конце stderr
я нахожу это сообщение согласно сценарию, который я запускаю:
модуль 'wordcount_minimal' не имеет атрибута ' main '
или
модуль 'wordcount_full' не имеет атрибута ' main '
Я выполнил задание с помощью команды:
pydoop submit --upload-файл-в-кэш wordcount_full.py wordcount_full hdfs_input_dir hdfs_output_dir
Невозможно найти причину этого. Есть идеи, в чем может быть причина?
Мне удалось выполнить пример из pydoop script
с использованием функций map
и reduce
, и он успешно завершен. Но с опцией pydoop submit
у меня есть эта проблема. Не уверен, что я что-то упустил.
PS: у меня кластер с 2 узлами, работающими Hortonworks HDP 2.6.5
. Pydoop
установлен на них обоих.