1. Что означает Num Off Switch Containers? Вышеуказанный случай имеет значение off switch locality
от планировщика задержки: -
| router|
+-----------+
/ \
+-----------+ +-----------+
|rack switch| |rack switch|
+-----------+ +-----------+
| data node | | data node |
+-----------+ +-----------+
| data node | | data node |
+-----------+ +-----------+
Это худший сценарий данныхлокальность (1.Node local 2. Rack local 3. off switch) с помощью Планировщик задержки , а память и vcores распределяются на другой стойке через коммутатор и гораздо более высокой пропускной способности.
Планировщик задержки назначает входящую задачу узлу выключения, который расположен в другой стойке, чтобы избежать голодания задачи
Для разных планировщиков в YARN имеются переменные конфигурации для порога узла и стойки: -
CAPACITY SCH : - С этим свойством yarn.scheduler.capacity.rack-locality-additional-delay
выполняется расслабляющая локализация для назначений контейнеров вне коммутатора.
acity-scheduler.xml
<property>
<name>yarn.scheduler.capacity.node-locality-delay</name>
<value>-1</value>
<description>Number of missed scheduling opportunities after which the CapacityScheduler attempts to schedule rack-local containers.
Typically this should be set to number of racks in the cluster, this
feature is disabled by default, set to -1.
</description>
</property>
https://issues.apache.org/jira/browse/YARN-4189 - JIRA для улучшения В случае, если кластер использует планировщик Fair: -
https://hadoop.apache.org/docs/r2.7.4/hadoop-yarn/hadoop-yarn-site/FairScheduler.html
yarn.scheduler.fair.locality.threshold.rack
https://cs.stanford.edu/~matei/papers/2010/eurosys_delay_scheduling.pdf для планирования задержки.
2.Какя могу идентифицировать эти контейнеры "выключения" и на каком узле (ах) они работали?
Чтобы просмотреть контейнеры для приложения, я считаю, что нам нужно перейти к конкретной попытке приложения с помощью идентификатора попытки, и там мыможно найти conatainer и его узел.Я не нашел прямой ссылки на отключение контейнера выключателя в RM ui
3. Помогает ли отключение контейнера выключателя сократить время обработки задания?
Да, сверху мы можемВ заключение отметим, что нагрузка на сеть замедлит обработку заданий.