Есть ли разница между HighAvailability (HA) для NameNode и HDFS? - PullRequest
0 голосов
/ 17 марта 2020

Я путаюсь между высокой доступностью HDFS и узлом имени, это две вещи одно и то же или разные?

Ответы [ 3 ]

0 голосов
/ 24 марта 2020

HDFS - это распределенная файловая система в проекте Had oop. HDFS имеет дело с распределенным хранилищем, т. Е. Хранит данные в виде блоков на узлах кластера.

HDFS - это ведущее ведомое устройство. Он имеет один или несколько мастеров, т. Е. NameNode (s) и один или несколько подчиненных узлов, т. Е. DataNodes.

HDFS имеет два типа данных:

  • Метаданные - управляются NameNode (s)
  • Данные - управляются DataNodes

В HDFS, метаданные играет важную роль для хранения и поиска актуальных данных. Таким образом, доступность NameNode очень важна для всего состояния кластера.

Чтобы обеспечить высокую доступность NameNode, HDFS обеспечивает Высокая доступность HDFS или Доступность NameNode

Примечание. Обе HDFS HA ​​и NameNode HA - это одни и те же темы

0 голосов
/ 14 апреля 2020

HDFS High Availability предоставляет возможность запуска двух NameNode в одном кластере в активной / пассивной конфигурации.

Насколько я понимаю, оба они относятся к одному и тому же явлению.

Вы можете получить лучшее понимание, обратившись к документации Cloudera здесь.

0 голосов
/ 24 марта 2020

Более или менее, когда NameNode не работает (что является единственной точкой отказа) в стандартном кластере, все кластеры HDFS будут недоступны, потому что в принципе ни одна другая роль / узел не может заменить его работа поэтому, когда мы говорим Высокая доступность HDFS , мы говорим о создании другого резервного NameNode для замены активного после его отключения.

Поэтому, чтобы ответить на ваш вопрос, я могу сказать да , вы можете назвать это ' Высокая доступность NameNode HDFS ', ' HDFS HA ​​', ' NameNode HA ' .. вы указываете на то же " Заставить кластер HDFS работать, когда узел NameNode не работает ".

...