Семейство HBase Column - PullRequest
       43

Семейство HBase Column

0 голосов
/ 27 августа 2018

HBase существует на пяти серверах с одной таблицей, содержащей один столбец Family, и я должен выполнить несколько map задач для каждого ключа и сохранить результат. главный вопрос:

для сохранения локальности данных , какая из них лучше: создайте новое семейство столбцов в таблице существования или создайте новую таблицу ?

и следующий вопрос:

Документация HBase предлагает сохранить менее трех семейств столбцов, и, как я уже сказал, у меня более десяти map заданий и будет сохранять каждый результат в новом семействе столбцов. Что мне делать? потому что каждая map задача отличается от другой. важны местность и стоимость поиска .

1 Ответ

0 голосов
/ 10 сентября 2018

какой из них лучше: создайте новое семейство столбцов на таблице существования или создайте новую таблицу

Я бы порекомендовал больше заботиться о схеме и простоте проектирования таблиц, а не пытаться взломать внутренние компоненты HBase для достижения максимальной производительности. Если информация из этих двух семейств столбцов связана, и вам необходимо получить доступ к обоим CF при сканировании с уменьшением карты - сохраните их в одной таблице. Если информация на 100% независима, и вам никогда не придется сканировать их одновременно - храните их в разных таблицах. Опять же, это вопрос разработки схемы, не пытайтесь выполнять преждевременную оптимизацию.

Второй вопрос - я не понял, о чем ты, извини.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...