HBase и Hadoop - PullRequest
       18

HBase и Hadoop

1 голос
/ 30 марта 2012

HBase требует установки Hadoop на основе того, что я прочитал до сих пор. И похоже, что HBase может быть настроен на использование существующего кластера Hadoop (который используется совместно с некоторыми другими пользователями) или его можно настроить на использование выделенного кластера Hadoop? Я предполагаю, что последняя будет более безопасной конфигурацией, но мне интересно, есть ли у кого-нибудь опыт работы с первой (но тогда я не очень уверен, что мое понимание установки HBase правильное или нет).

Ответы [ 3 ]

3 голосов
/ 30 марта 2012

Я знаю, что Facebook и другие крупные организации отделяют свой кластер HBase (доступ в реальном времени) от своего кластера Hadoop (пакетная аналитика) по соображениям производительности.Большие задания MapReduce в кластере могут влиять на производительность интерфейса реального времени, что может быть проблематично.

В небольшой организации или в ситуации, когда время отклика HBase не обязательно должнобудьте последовательны, вы можете просто использовать один и тот же кластер.

Существует не так много (или вообще) проблем с сосуществованием, кроме проблем с производительностью.

0 голосов
/ 14 апреля 2012

В распределенном режиме Hadoop используется для хранения HDFS. HBase будет хранить HFile в HDFS и, таким образом, получать преимущества от стратегий репликации и принципов локальности данных, представленных датододами.

RegionServer собирается в основном обрабатывать локальные данные, но все же, возможно, придется получать данные из других датоданов.

Надеюсь, это поможет вам понять, почему и как используется hadoop с HBase.

0 голосов
/ 30 марта 2012

Мы настроили его на существующий кластер Hadoop, который имеет 1000 ядер.Короткий ответ: он отлично работает, по крайней мере, с Cloudera CH2 + 149.88 .Но в зависимости от версии Hadoop ваш пробег может отличаться.

...