Является ли HBase стабильным и готовым к производству? - PullRequest
9 голосов
/ 20 июня 2009

Для людей, которые развернули HBase в своих кластерах, считаете ли вы, что он достаточно стабилен для производственного использования? С какими проблемами вы сталкиваетесь?

Я вижу группу компаний, которые используют HBase в производственной среде (http://wiki.apache.org/hadoop/Hbase/PoweredBy),), но мне любопытно, много ли техобслуживания, исправлений и ошибок запускает для поддержания работы кластера HBase.

1 Ответ

10 голосов
/ 26 июня 2009

HBase собирается достичь важной вехи с HBase-0.20. Там есть альфа и скоро будет RC. У него были очень серьезные улучшения производительности. Сообщается, что StumbleUpon обслуживает их сайт в режиме реального времени в виде транковой версии HBase без дополнительного уровня кэширования, как это делают другие. Так что я бы сказал, что он определенно готов к использованию.

Райан Роусон (из StumbleUpon) недавно на конференции nosql дал хороший доклад , в основном о том, как далеко он продвинулся за последние 6 месяцев. Есть слайды, если вы не хотите смотреть все это. Помимо повышения производительности, другим важным дополнением является интеграция с zookeeper, поэтому мастер больше не является единственной точкой отказа.

HBase использовался для небольших размеров ячеек из-за проблем с памятью из-за ограничения формата файла. Эта проблема также была решена с помощью нового пользовательского формата файлов, который также позволил повысить производительность.

Я экспериментирую с HBase уже около года, я готов доверить 0.20 производственному сервису, я был не совсем со старыми версиями. Я рекомендовал по крайней мере 4 или 5 узлов devcluster при экспериментировании.

Я не могу прокомментировать, что такое забота о производственном кластере, потому что мы только начали с производственного. Помогает и то, что список рассылки чрезвычайно активен, а irc постоянно используется, поэтому существует очень сильное сообщество, которое по крайней мере помогает.

...