HBase таблицы не сжимаются, как ожидалось - PullRequest
2 голосов
/ 18 октября 2011

У меня есть отдельный экземпляр HBase (без hadoop), работающий на одной машине.

Первоначально он был на 32G, после обновления некоторых определений столбцов из оболочки:

alter 'table', {NAME =>'mycol', TTL => <two_months>}
alter 'table', {NAME =>'mycol', COMPRESSION => 'GZ'}

Хранилище данных выросло за ночь с 32G до 51G (не вызвано новыми данными!).Я ожидаю, что таблица сократится, так как большинство записей старше двух месяцев.Кроме того, я запросил сжатие для столбца.

Я хотел бы понять, почему запуск команды alter вызвал значительное увеличение размера, и можно ли ожидать его повторного сжатия?

Я ожидал, что оно сократится при следующем крупном уплотнении, прошло> 24 часа, и я удивлен, что это еще не произошло.

1 Ответ

1 голос
/ 21 октября 2011

Для проблемы с TTL просто форсируйте большое уплотнение, как сказал юханик.Сжатие сложнее, хотя hbase пока не имеет метода автоматического объединения блоков (в jira есть проблемы с этим), количество блоков (регионов) не изменится.Когда я переключаю сжатие, я предпочитаю экспортировать -> усечь -> повторно импортировать данные.

Небольшой совет: если проблема с размером, то самая простая оптимизация - снизить значение VERSIONS (до 1, если возможно).Я думаю, вы уже сделали это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...