Если oop по умолчанию поддерживает стойки, и все узлы попадают под одну стойку, называемую /default-rack
. Если в кластере есть несколько стоек, в пределах центра обработки данных или охвата центров обработки данных, oop компонентов (особенно Namenode) должны быть уведомлены об этих различных стойках.
В случае oop прочитайте, что топология стойки может быть настроена путем предоставления IP-адресов стоек или связанных с ними имен хостов.
Да, сценарий, который может генерировать сопоставление между IP-адресом или именем хоста узла данных максимум до одного rack потребуется для настройки топологии стойки.
Означает ли это, что в одном кластере Had oop теоретически могут быть разные стойки в совершенно разных географических местоположениях, если они доступны (могут быть проверены ) из NameNode?
Да, они должны быть доступны для всех узлов в кластере. Но в качестве лучшей практики не рекомендуется размещать узлы в разных географических точках, поскольку это может увеличить задержку сети между узлами.
Если это так, я бы предположил, что стратегия репликации блоков, определенных алгоритмом осведомленности о стойке, будет такой же.
Да. Политика размещения блоков одинакова для всех вариантов топологии стойки.