Вам нужно начать с получения правильных логов.
Посмотрите на url to track the job
адрес для адреса YARN.
Если этот адрес недоступен, вы можете скопировать полный идентификатор приложения в команду logs
yarn logs -applicationId application_1540...
Оттуда вы можете искать трассировку стека, сгенерированную кодом.
Если вы только что настроили Hadoop, я бы предположил, что hdfs dfs -ls /wordcount_input/
выдает некоторую ошибку о несуществовании или об отказе в разрешении