LocalJobRunner был выбран, поскольку ваша конфигурация, скорее всего, имеет свойство mapred.job.tracker
, установленное на local
, или не было задано вообще (в этом случае по умолчанию используется значение local). Чтобы проверить, перейдите в «где бы вы ни распаковали / установили hadoop» / etc / hadoop / и посмотрите, существует ли файл mapred-site.xml (для меня его не было, там был файл mapped-site.xml.template). В этом файле (или создайте его, если он не существует) убедитесь, что он имеет следующее свойство:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
- См. Источник для
org.apache.hadoop.mapred.JobClient.init(JobConf)
Каково значение этого свойства конфигурации в конфигурации hadoop на машине, с которой вы отправляете это? Также убедитесь, что исполняемый файл hadoop, на котором вы работаете, ссылается на эту конфигурацию (и что у вас 2+ установки не настроены по-разному) - введите which hadoop
и отследите любые символические ссылки, с которыми вы столкнулись.
В качестве альтернативы вы можете переопределить это при отправке работы, если вы знаете хост и номер порта JobTracker, используя опцию -jt:
hadoop jar MyRandomForest_oob_distance.jar -jt hostname:port hdfs://montana-01:8020/user/randomforest/input/genotype1.txt hdfs://montana-01:8020/user/randomforest/input/phenotype1.txt hdfs://montana-01:8020/user/randomforest/output1_distance/ hdfs://montana-01:8020/user/randomforest/input/genotype101.txt hdfs://montana-01:8020/user/randomforest/input/phenotype101.txt 33 500 1