Как избежать расщепления области Hbase при каждом перезапуске RS? - PullRequest
0 голосов
/ 21 февраля 2019

Я администратор кластера, где есть более 100 серверов Region для HBase и более 50 таблиц, которые выполняют групповую загрузку, пакетную загрузку из приложений Spark Batch, Streaming, Map-Reduce.Каждый раз, когда мы выполняем какое-либо обслуживание RS, мы замечаем, что большинство таблиц получают новое разделение после запуска RS, что увеличивает общее количество регионов.Я вижу, что из блогов Hbase более 200 регионов / RS не рекомендуется.Мы запускаем HDP 2.6.5, поэтому версия HBase 1.1.2.Итак, мой вопрос

  1. Что я, как администратор, могу сделать, чтобы избежать этих дорогостоящих расколов?

  2. Должен ли я попытаться решить эту проблему за столомуровень свойств, такой как splitpolicy, сжатия [Примечание: даже при использовании политики постоянного разделения я вижу разделение регионов даже до достижения максимального предела hfile]

  3. Это решено в HBase 2.0 или более поздней версии?Наше планирование емкости для добавления / уменьшения RS зависит от количества регионов в кластере.

Заранее спасибо ..!

Happy Hadooping:)

Махадеван

...