У вас есть представление о семействах столбцов: по сути, это всего лишь подсказка для HBase хранить и реплицировать эти элементы вместе для более быстрого доступа.
Если вы помещаете два семейства столбцов в одну таблицу и всегда имеете разные ключи для доступа к ним, то это действительно то же самое, что иметь их в двух отдельных таблицах. Вы получаете выгоду, только имея два семейства столбцов в одной таблице, к которым обращаются через одни и те же ключи.
Например: если у меня есть столбцы для общего количества просмотров страниц для данного веб-сайта, количества уникальных просмотров для того же сайта, браузера, который пользователь использует для просмотра сайта, и их интернет-соединения, я могу решить, что я хочу, чтобы первые два были семейством столбцов, а последние два - другим семейством столбцов. Здесь все четыре доступны с помощью одного и того же ключа, а именно веб-сайта, о котором идет речь, поэтому я выигрываю, когда они находятся в одной таблице.
Если бы они находились в разных таблицах, я бы в конечном итоге должен был выполнить операцию, аналогичную соединению этих двух таблиц. Хотя я на самом деле не знаю чисел, поэтому не могу сказать, насколько медленна операция соединения (поскольку я не помню, чтобы у HBase было соединение, поскольку оно нереляционное) и каков переломный момент, когда расщепление их в отдельные таблицы перевешивает наличие их в одной таблице (или наоборот).
Конечно, все это зависит от данных, которые вы пытаетесь сохранить, поэтому, если вам никогда не понадобится объединять таблицы, вам следует хранить их в отдельных таблицах, поскольку вы можете утверждать, что они не связаны между собой. друг другу в первую очередь.