Данные разбиваются на блоки определенного размера, а затем реплицируются на другие узлы в кластере для надежности. Этот процесс обрабатывается одним «узлом имени», который отслеживает, куда и куда ушли блоки данных.
Hadoop предоставляет вам виртуальную файловую систему, аналогичную Unix, к которой вы можете обращаться с помощью различных инструментов файловой системы Hadoop (ls, get, put и т. Д.)
Эта ссылка должна дать вам полный обзор.