В HBase таблица разбивается на регионы путем разделения пространства ключей, которое сортируется лексикографически. Каждый регион таблицы принадлежит одному серверу регионов, поэтому все операции чтения и записи обрабатываются этим сервером (что обеспечивает надежную согласованность). Это означает, что если все ваши операции чтения или записи сконцентрированы на небольшом диапазоне вашего пространства ключей, вы сможете масштабировать только то, что может обрабатывать один сервер региона. Например, если ваши данные представляют собой временные ряды и снабжены меткой времени, тогда все записи идут в последнюю область таблицы, и вы будете ограничены записью со скоростью, которую может обрабатывать один сервер.
С другой стороны, если вы можете выбрать свои ключи так, чтобы любому заданному запросу нужно было сканировать только небольшой диапазон строк, но чтобы общий набор операций чтения и записи распределялся по вашему пространству ключей, тогда общая нагрузка будет распределены и хорошо масштабируются, но вы все равно можете пользоваться преимуществами локальности для вашего запроса.