Я рассматриваю возможность использования GUIID в качестве имен столбцов в таблице HBase для конкретного случая использования.Я знаю, что длинные имена занимают место в каждом ряду, но кроме пробела, есть ли дополнительный удар по производительности, который HBase собирается испытать?Моя главная задача - скорость, а не дисковое пространство.
Поскольку таблицы HBase редки, я думаю об уникальных именах столбцов для каждого идентификатора пользователя (GUID).Все эти столбцы будут частью одного семейства столбцов (только одно семейство столбцов для всей таблицы).
Поскольку большинство из них будут пустыми, я не слишком озабочен пространством.Что меня беспокоит, так это какое-либо влияние на скорость операций Get и Put.У меня есть компромисс между использованием этих значений в качестве ключей строк в отдельной таблице (в этом случае моя операция будет включать в себя 4 Gets и 4 Puts) или с этим путем, с длинными именами столбцов (в этом случае моя операция будет включать только 2 Gets и2 ставок).Боюсь, однако, что как только Get быстро найдет строку, потребуется ли слишком много времени для перебора имен столбцов, чтобы найти правильные?(против того, как быстро он сможет найти то же значение, если бы он был ключом строки в отдельной таблице).Мы говорим о тысячах потенциальных значений, а не о миллионах и т. Д.
Я собираюсь провести некоторый эмпирический бенчмаркинг, но какой теоретический способ предпочтителен для этого?