Теперь я управляю небольшим кластером hbase, состоящим из примерно десяти серверов регионов, на котором каждый сервер регионов содержит более 1000 регионов. Это выглядит нехорошо, поэтому в файле журнала появляется предупреждение 'Общее число регионов приближается кверхний предел 1000. Пожалуйста, обратите внимание на http://hbase.apache.org/book.html#ops.regionmgt’. Но кластер работал хорошо в течение долгого времени, без каких-либо исключений.
Я ссылался на официальное добавление документа, нашел описание ниже:
Если вы заполняете все регионы с примерно одинаковой скоростью, использование глобальной памяти приводит к крошечным сбрасываниям, когда у вас слишком много регионов, что, в свою очередь, приводит к уплотнению.Перезапись одних и тех же данных десятки раз - это последнее, что вы хотите.Примером является одинаковое заполнение 1000 регионов (с одним семейством), и давайте рассмотрим нижнюю границу для глобального использования MemStore 5 ГБ (у сервера регионов будет большая куча).Как только он достигнет 5 ГБ, он принудительно очистит самый большой регион, в этот момент почти у всех должно быть около 5 МБ данных, поэтому он сбросит этот объем.Если вставить 5 МБ позже, это приведет к сбросу другой области, в которой теперь будет более 5 МБ данных, и так далее. В настоящее время это основной ограничивающий фактор для количества регионов ;
Но я не могу понять, почему это может быть основным ограничивающим фактором.Какое влияние будет оказано, если один за другим очистить этот небольшой магазин?