HDFS - это распределенная файловая система в проекте Had oop. HDFS имеет дело с распределенным хранилищем, т. Е. Хранит данные в виде блоков на узлах кластера.
HDFS - это ведущее ведомое устройство. Он имеет один или несколько мастеров, т. Е. NameNode (s) и один или несколько подчиненных узлов, т. Е. DataNodes.
HDFS имеет два типа данных:
- Метаданные - управляются NameNode (s)
- Данные - управляются DataNodes
В HDFS, метаданные играет важную роль для хранения и поиска актуальных данных. Таким образом, доступность NameNode очень важна для всего состояния кластера.
Чтобы обеспечить высокую доступность NameNode, HDFS обеспечивает Высокая доступность HDFS или Доступность NameNode
Примечание. Обе HDFS HA и NameNode HA - это одни и те же темы