HBase собирается достичь важной вехи с HBase-0.20. Там есть альфа и скоро будет RC. У него были очень серьезные улучшения производительности. Сообщается, что StumbleUpon обслуживает их сайт в режиме реального времени в виде транковой версии HBase без дополнительного уровня кэширования, как это делают другие. Так что я бы сказал, что он определенно готов к использованию.
Райан Роусон (из StumbleUpon) недавно на конференции nosql дал хороший доклад , в основном о том, как далеко он продвинулся за последние 6 месяцев. Есть слайды, если вы не хотите смотреть все это. Помимо повышения производительности, другим важным дополнением является интеграция с zookeeper, поэтому мастер больше не является единственной точкой отказа.
HBase использовался для небольших размеров ячеек из-за проблем с памятью из-за ограничения формата файла. Эта проблема также была решена с помощью нового пользовательского формата файлов, который также позволил повысить производительность.
Я экспериментирую с HBase уже около года, я готов доверить 0.20 производственному сервису, я был не совсем со старыми версиями. Я рекомендовал по крайней мере 4 или 5 узлов devcluster при экспериментировании.
Я не могу прокомментировать, что такое забота о производственном кластере, потому что мы только начали с производственного. Помогает и то, что список рассылки чрезвычайно активен, а irc постоянно используется, поэтому существует очень сильное сообщество, которое по крайней мере помогает.