Hadoop namenode метаданные - PullRequest
       40

Hadoop namenode метаданные

0 голосов
/ 07 июня 2011

Я немного смущен архитектурой Hadoop.

  1. Какие метаданные файла хранятся в Hadoop Namenode? В вики Hadoop говорится, что Namenode хранит все пространство имен системы. Хранится ли в Namenode информация, такая как время последнего изменения, время создания, размер файла, владелец, разрешения и т. Д.

  2. Хранит ли датоде какую-либо информацию метаданных?

  3. Существует только один Namenode, могут ли данные метаданных превышать лимит сервера?

  4. Если пользователь хочет загрузить файл из Hadoop, должен ли он загружать его из Namenode? Я обнаружил нижеприведенное изображение архитектуры из Интернета, оно показывает, что клиент может напрямую записывать данные в datanode? Это правда? enter image description here

Спасибо !!!!!!!

Ответы [ 6 ]

4 голосов
/ 08 июня 2011

Я думаю, что следующее объяснение поможет вам лучше понять архитектуру HDFS. Вы можете считать узел Name похожим на FAT (таблица размещения файлов) + данные каталога и узлы данных как на простые устройства. Если вы хотите прочитать файл из обычной файловой системы, вы должны перейти в каталог, затем перейти к FAT, получить расположение всех соответствующих блоков и прочитать их. То же самое происходит с HDFS. Когда вы хотите прочитать файл, вы идете в Namenode, получаете список блоков, которые есть у данного файла. Эта информация о блоках будет содержать список датоделей, где эта информация находится. После этого вы идете к датоде и получаете от них соответствующие блоки.

2 голосов
/ 08 июня 2011
  1. fsimage на узле имени в двоичном формате. Используйте «Offline Image Viewer» для выгрузки fsimage в удобочитаемом формате. Выходные данные этого инструмента могут быть дополнительно проанализированы с помощью свиньи или другого инструмента, чтобы получить более значимые данные.

http://hadoop.apache.org/hdfs/docs/r0.21.0/hdfs_imageviewer.html

1 голос
/ 10 декабря 2011

3) Когда файлы no.of настолько велики, один Namenode не сможет сохранить все метаданные.На самом деле это одно из ограничений HDFS.Вы можете проверить федерацию HDFS, которая направлена ​​на решение этой проблемы, разбившись на разные пространства имен, обслуживаемые разными наменодами.

4)

Read process :    
a) Client first gets the datanodes where the actual data is located from the namenode 
b) Then it directly contacts the datanodes to read the data

Write process : 
a) Client asks namenode for some datanodes to write the data and if available Namenode gives them 
b)Client goes directly to the datanodes and write
1 голос
/ 07 июня 2011
  1. да
  2. нет, кроме самих блоков
  3. да, если у вас много маленьких файлов
  4. нет, информация о файле находится наНаменод, сам файл находится на Датододах (теоретически, датодода может быть на одной машине, и часто на небольших кластерах)
0 голосов
/ 10 февраля 2016
  1. Да, NameNode управляет этим.Также часто эти данные будут сохраняться в fsimage и редактировать файлы, которые будут на локальном диске.

  2. Нет, все метаданные будут поддерживаться NameNode.Из-за этого бремя данных будет меньше для поддержки метаданных.

  3. Будет только один основной NameNode.Как я уже говорил, для управления лимитом размера метаданных данные будут часто сохраняться в fsimage и редактироваться через контрольные точки.

  4. Клиент может связаться с DataNode, как только он получает информацию о файле от NameNode.

0 голосов
/ 08 августа 2014

Для вопроса № 4. Клиент записывает данные непосредственно в Datanode.Однако, прежде чем он сможет записать в DataNode, он должен поговорить с Namenode, чтобы получить метаданные, например, какой Datanode и в какой блок записывать.

...