Как работает вторичная архитектура имени узла глубоко внутри? - PullRequest
0 голосов
/ 28 июня 2019

В блоге Cloudera мы читаем следующее:

"SecondaryNameNode периодически сжимает EditLog в «Контрольная точка», тогда EditLog очищается. Перезапуск NameNode затем включает в себя загрузку самой последней контрольной точки и более короткий EditLog содержит только события с контрольной точки "

Также на другой веб-странице:

"когда контрольная точка будет создана, вторичный узел отправляет fsimage и редактировать файлы с именем узла "

У меня есть несколько вопросов, и, возможно, вы можете связать меня с некоторыми ресурсами / книгами, чтобы прочитать следующую информацию:

Вопрос 1:

Я не понимаю, почему узел SecodnaryName отправляет редактировать файлы обратно на NameNode ? NameNode нужна только контрольная точка при запуске, верно? NameNode уже имеет одинаковых файлов редактирования (контрольные точки создаются на основе этих файлов редактирования). Может быть, это необходимо для очистки редактировать файлы? Может быть, это "более короткий EditLog" , который упоминается в документации?

enter image description here

Вопрос 2:

Как NameNode очищает файлы редактирования? Исходные файлы редактирования заменяются новыми, полученными из узла вторичного имени? Или, может быть, есть другие процессы, которые очищают поля редактирования на основе содержимого chec-kpoint?

Вопрос 3:

После отправки файлов редактирования с NameNode на SecondaryNode, может ли это редактировать файлы , измененные в NameNode? Или требуется создать новые файлы редактирования после того, как они будут отправлены на вторичный узел имени для резервного копирования?

Вопрос 4:

Я также читал, что Secondary NameNode требует столько же ОЗУ, сколько NameNode. Это странно. Зачем? Основная задача для узла Secondary name - создавать моментальные снимки, которые требуют в основном ввода-вывода, не так ли?

...