Будут ли HBase хранить семейства столбцов для одной и той же строки на другом компьютере? - PullRequest
6 голосов
/ 22 ноября 2010

Семейства столбцов для одной и той же строки принадлежат одному и тому же RegionServer. Итак, вопрос в том, будет ли RegionServer хранить разные семейства столбцов на разных машинах?

Ответы [ 2 ]

4 голосов
/ 26 февраля 2011

Не обязательно, но в какой-то момент так и будет.Это часть базовой архитектуры HBase.Если вы представляете таблицу HBase как электронную таблицу со своими строками и столбцами, то область охватывает несколько последовательных строк в одном направлении и все столбцы одного или нескольких семейств столбцов.Таким образом, весь лист покрывается плитками областей.

Каждая область хранится на одном или нескольких (обычно трех) узлах кластера.(Если вы потеряете все узлы, содержащие определенный регион, вы потеряете все данные региона. Если вы потеряете только одну реплику, HBase гарантирует, что она реплицируется на другой узел из оставшихся копий.)

Теперь, когда данные, содержащиеся в области, становятся слишком большими, HBase автоматически инициирует разделение областей, в результате чего получаются две новые области, каждая из которых содержит половину данных.Только через разбиение по регионам (помимо репликации по областям) данные в конечном итоге распределяются по кластеру HBase.

Хранение данных для одной строки в разных столбцах одного и того же семейства столбцов гарантирует, что данные хранятся вместе в одном месте.

0 голосов
/ 25 июля 2013

Если данные в таблице достаточно велики, HBase разделит таблицу на разные регионы.Поскольку HBase является базой данных, ориентированной на столбцы, разные семейства столбцов будут храниться в разных регионах.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...