Мне нужно выполнить запрос, который извлекает все строки с идентификатором в диапазоне (id1, id2) и отметкой времени в диапазоне (t1, t2). Тем не менее, мне очень трудно работать в HBase без индекса.
Диапазоны идентификаторов очень велики, например, могут охватывать более 200000000. Однако мои идентификаторы очень редки, что означает, что может быть только 100 идентификаторов в диапазоне (100000000,200000000)
Кроме того, диапазоны меток времени из запроса также имеют тенденцию к большому, что может охватывать от 2 до 3 лет.
Я рассматривал дизайн rowkey как форму id-timestamp или timestamp-id, но, кажется, невозможно добавить все возможные диапазоны rowkey, поскольку они оба охватывают очень много чисел.
Есть ли эффективный способ решения такой конкретной проблемы запроса в HBase без использования индекса?