HBase существует на пяти серверах с одной таблицей, содержащей один столбец Family, и я должен выполнить несколько map
задач для каждого ключа и сохранить результат.
главный вопрос:
для сохранения локальности данных , какая из них лучше: создайте новое семейство столбцов в таблице существования или создайте новую таблицу ?
и следующий вопрос:
Документация HBase предлагает сохранить менее трех семейств столбцов, и, как я уже сказал, у меня более десяти map
заданий и будет сохранять каждый результат в новом семействе столбцов. Что мне делать? потому что каждая map
задача отличается от другой. важны местность и стоимость поиска .