Hadoop вообще не является базой данных. Hadoop - это набор инструментов для распределенного хранения и обработки, таких как распределенная файловая система (HDFS), библиотеки инфраструктуры MapReduce, менеджер ресурсов YARN.
Другие инструменты, такие как Hive, Spark, Pig, Giraph, sqoop и т. Д., Могут использовать Hadoop или его компоненты. Например, Hive - это база данных. Он использует HDFS для хранения своих данных и примитивы инфраструктуры MapReduce для построения графика выполнения запросов.