Question

У меня есть некоторый опыт работы с Lucene, я пытаюсь понять, как на самом деле данные хранятся на подчиненном сервере в среде Hadoop?
Мы создаеминдекс в подчиненном сервере с набором атрибутов для описания документа, который мы храним?как это работает в реальности?

Matthew Hegarty · Answer 1 · 20 сентября 2010

Данные разбиваются на блоки определенного размера, а затем реплицируются на другие узлы в кластере для надежности. Этот процесс обрабатывается одним «узлом имени», который отслеживает, куда и куда ушли блоки данных.

Hadoop предоставляет вам виртуальную файловую систему, аналогичную Unix, к которой вы можете обращаться с помощью различных инструментов файловой системы Hadoop (ls, get, put и т. Д.)

Эта ссылка должна дать вам полный обзор.

Hadoop Data Persistance в каком формате?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Hadoop Data Persistance в каком формате?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы