Я настроил Hadoop на AWS несколько дней назад и провел тест на количество слов. Но задача не достигла прогресса за 40 минут. Любая задача, включая загруженную пряжу, тоже не работала. У меня есть 1 Наменод (Хозяин) и 2 Датанод (Рабы).
Я просматриваю файл журнала, сначала журнал менеджера ресурсов показывает, что:
WARN org.apache.hadoop.ipc.Client: Failed to connect to server: Slave2/172.31.25.60:38729: And Failed to connect to server: Slave1/balabalablabla
Я также заметил эту ошибку в журнале:
java.net.ConnectException: Connection refused
Затем я загружаю журнал Datanode, в котором была выполнена задача, после прочтения журнала я предполагаю, что Datanode2 завершил задачу, но в то время не может связаться с Namenode.
Вот файл журнала: yarn-ubuntu-resourcemanager-ambari.master.com:
https://github.com/MasterMiror/Hadoop/blob/master/yarn-ubuntu-resourcemanager-ambari.master.com.log (14.6mb просто игнорировать другую часть журнала, я забыл почистить ее, прочитайте последнюю часть в порядке)
Журнал Datanode2 (на нем выполнялась задача wordcount):
журнал mapreducetask (возможно, вы думаете, что в каждом каталоге должно быть 3 файла, но 3 файла имеют размер 0 Кб, поэтому они не были загружены на github)
Вот мой файл конфигурации
HDFS-site.xml:
<configuration>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>Master:50090</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/home/ubuntu/hadoopdata/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/ubuntu/hadoopdata/datanode</value>
</property>
</configuration>
ядро-site.xml:
<configuration>
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://Master/</value>
</property>
</configuration>
</configuration>
пряжи site.xml:
<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>Master</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
mapred-site.xml:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>