Что на самом деле означает yarn.resourcemanager.am.max-попытки? - PullRequest
1 голос
/ 19 октября 2019

У меня есть запись конфигурации в yarn-site.xml следующим образом:

<property>
  <name>yarn.resourcemanager.am.max-attempts</name>
  <value>4</value>
</property>

Я бы спросил, что это на самом деле означает, учитывая следующие два сценария:

  1. Скажем, у меня есть ApplicationMaster, и в нем есть ошибка. Когда я отправлю приложение в YARN, оно попытается запустить Application Master 5 раз, а затем завершит работу приложения (я предполагаю, что ошибка приводит к невозможности запуска AM)

  2. Скажите ,Я запустил приложение пряжи , и вручную завершил процесс ApplicationMaster. Будет ли приложение ApplicationMaster автоматически перезапущено? Если это так, я делаю kill the application - application restarted еще 4 раза, АМ больше не будет перезапущен?

1 Ответ

1 голос
/ 12 ноября 2019

Допустим, АМ глючит и умирает. Или у него есть утечка памяти, которая заставляет его превышать размер контейнера и уничтожаетсяЕсли он умирает 4 раза, то состояние приложения равно FAILED.

Итак, чтобы ответить на ваш вопрос, 1 - это правда, если вы имеете в виду 4 вместо 5, а 2 - это правда. Если вы хотите понять это больше, посмотрите на TestAMRestart.java .

...