Question

В файлах конфигурации есть 2 свойства, с которыми я путаюсь:

Свойство yarn.nodemanager.remote-app-log-dir in yarn-site.xml:

a.) Это свойство управляет,где будут регистрироваться журналы задач сопоставления / уменьшения?

b.) За это отвечает Node Manager (NM)?
Свойство mapreduce.jobhistory.done-dir отmapred-site.xml:

a.) Файлы, связанные с заданиями, такие как конфигурации и т. Д., Хранятся в этом месте?

b.) За это отвечает Application Master (AM)?
Объединяет ли сервер истории (HS) обе эти данные и отображает сводную информацию в пользовательском интерфейсе?

kylin · Answer 1 · 15 июня 2018

Предполагая, что вы включили агрегирование журналов,

1.a. Это каталог агрегации журналов, обычно HDFS, в который NMs агрегирует контейнерные журналы.
1.b. Да.
2.a. Да.
2.b. Нет. MR JobHistory Server сделает это, удалив файл JobSummary и другие файлы mv в $ {mapreduce.jobhistory.done-dir} из $ {mapreduce.jobhistory..intermediate-Done-Dir}.
3. Да.Сервер MR JobHistory Web, содержит информацию о задании (из $ {mapreduce.jobhistory.done-dir}) и журналы контейнеров (из $ {yarn.nodemanager.remote-app-log-dir}).

Как работает сервер истории Hadoop?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.