Hbase дизайн для запроса диапазона идентификаторов и временного диапазона - PullRequest
0 голосов
/ 01 апреля 2020

Мне нужно выполнить запрос, который извлекает все строки с идентификатором в диапазоне (id1, id2) и отметкой времени в диапазоне (t1, t2). Тем не менее, мне очень трудно работать в HBase без индекса.

Диапазоны идентификаторов очень велики, например, могут охватывать более 200000000. Однако мои идентификаторы очень редки, что означает, что может быть только 100 идентификаторов в диапазоне (100000000,200000000)

Кроме того, диапазоны меток времени из запроса также имеют тенденцию к большому, что может охватывать от 2 до 3 лет.

Я рассматривал дизайн rowkey как форму id-timestamp или timestamp-id, но, кажется, невозможно добавить все возможные диапазоны rowkey, поскольку они оба охватывают очень много чисел.

Есть ли эффективный способ решения такой конкретной проблемы запроса в HBase без использования индекса?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...