Я администратор кластера, где есть более 100 серверов Region для HBase и более 50 таблиц, которые выполняют групповую загрузку, пакетную загрузку из приложений Spark Batch, Streaming, Map-Reduce.Каждый раз, когда мы выполняем какое-либо обслуживание RS, мы замечаем, что большинство таблиц получают новое разделение после запуска RS, что увеличивает общее количество регионов.Я вижу, что из блогов Hbase более 200 регионов / RS не рекомендуется.Мы запускаем HDP 2.6.5, поэтому версия HBase 1.1.2.Итак, мой вопрос
Что я, как администратор, могу сделать, чтобы избежать этих дорогостоящих расколов?
Должен ли я попытаться решить эту проблему за столомуровень свойств, такой как splitpolicy, сжатия [Примечание: даже при использовании политики постоянного разделения я вижу разделение регионов даже до достижения максимального предела hfile]
Это решено в HBase 2.0 или более поздней версии?Наше планирование емкости для добавления / уменьшения RS зависит от количества регионов в кластере.
Заранее спасибо ..!
Happy Hadooping:)
Махадеван