Это зависит.Как всегда, есть три основных узких места:
1) ЦП
2) Сетевой ввод / вывод
3) Дисковый ввод / вывод
Если ваше приложениев настоящее время привязан к процессору, или если ваши данные имеют высокую частоту обращений к кешу с дополнительными узлами, тогда полезны дополнительные узлы HBase.Если ваше приложение в основном связано с диском или сетью, то дополнительные узлы HBase не сильно помогут (если добавление большего количества узлов значительно не увеличит частоту обращений в кэш).
Как правило, вы хотите, чтобы ваши узлы hbase работали на узлах hdfs, чтобы он мог использовать преимущества локального доступа к данным.Я нашел бы другие ситуации несколько необычными.