Я знаю, что не могу иметь дубликаты первичных ключей в любой базе данных, но cassandra ограничивает мою возможность запрашивать только 1 из ключей в составном первичном ключе.
Мой пример использования следующий:
File 1
variableA
variableB
variableC
File 2
variableC
variableD
variableE
Я хочу создать таблицы следующим образом:
variables
==================
variable_id PK
file_id PK
UUID PK
files
==================
file_id PK
...other_columns
Я анализирую файлы и вставляю переменные втаблица переменных.Позже я хочу найти все файлы с переменной C.Однако, хотя у меня есть file_id, когда я создаю запись, у меня нет file_id во время запроса.В отличие от других кассетных БД, я должен указать оба PK в своем запросе.Это невозможно.
Мне нужны некоторые идеи о том, как преодолеть эту проблему моделирования.
Потенциально будут триллионы переменных, поэтому ALLOW FILTERING и вторичные индексы не подходят.Это не может быть уникальным вариантом использования.Как другие преодолели эту проблему?