У Cloudera есть таблица, которая дает эквиваленты основных проектов Hadoop в терминах стека Google:
MapReduce | MapReduce
GFS | HDFS
BigTable | HBase
Chubby | ZooKeeper
Sawzall | Hive, Pig
Это, и особенно первые четыре, являются основными компонентами, на которых строятся другие.MapReduce порождает работников как можно ближе к данным, с которыми они будут работать.HDFS реплицирует неструктурированные данные.HBase - это хранилище столбцов.ZooKeeper выполняет поиск сервисов, блокировку и выбор лидера.Hive и Pig - это высокоуровневые языки запросов, которые реализованы в виде вычислений MapReduce для данных HBase.
В экосистеме проекта есть гораздо больше от автономных инструментов, таких как Avro (сериализация, буферы протокола анализа)наборы инструментов, такие как Mahout (машинное обучение), для полнофункциональных продуктов, таких как Nutch (поисковая система и поисковая система, из которой был выделен Hadoop).
Интеграторы создают дистрибутивы стеков Hadoop и Hadoop (Hadoop свободнов сочетании, а некоторые предоставляют альтернативы важным компонентам);основные проекты поддерживаются фондом Apache.