Полный ключ строки хранится в каждой ячейке, обеспечивая разреженное хранение.
Это означает, что полная строка будет записана для каждой отдельной строки: семейство: ключ столбца.Имена столбцов также сохраняются.
Это, очевидно, означает, что большие имена строк / столбцов будут занимать много места на диске.
Многое из этого можно уменьшить с помощью lzo storage: http://wiki.apache.org/hadoop/UsingLzoCompression
У Ларса Джорджа есть очень хорошая статья о базовой компоновке данных в hbase (сейчас она немного устарела, но базовая компоновка все еще остается прежней): http://www.larsgeorge.com/2009/10/hbase-architecture-101-storage.html