HBase и масштабирование читает - PullRequest
0 голосов
/ 01 марта 2012

У меня есть кластер HBase с коэффициентом репликации 3. Я пытаюсь улучшить производительность чтения, чтобы у меня было больше возможностей "Получить в секунду".

Когда я проверяю с пометкой Gets (reads), я устанавливаюподключение к HBase с использованием пула htable и подключение к таблице.Затем я многократно читал одну и ту же строку снова и снова с более быстрыми интервалами и отслеживал загрузку кластера.Все узлы в кластере имеют одинаковое оборудование.То, что я заметил, это то, что загрузка процессора на одном узле, когда вверх.Учитывая, что я настроил кластер с коэффициентом репликации 3, я бы предположил, что чтение будет выполняться для любой копии данных, а не для одной копии на одном узле (я ожидаю увидеть увеличение нагрузки на 3серверы, а не один).

Как можно улучшить производительность чтения, чтобы мои запросы Get были лучше сбалансированы по 3 реплицированным наборам данных, а не считывались с одного узла.

Спасибо

1 Ответ

1 голос
/ 02 марта 2012

Коэффициент репликации 3 означает, что базовые блоки HDFS реплицируются 3 раза, но каждая область HBase обслуживается одним HRegionServer, поэтому одна строка может обслуживаться только из одного местоположения.

...