Об использовании индексов в Кассандре - PullRequest
0 голосов
/ 10 сентября 2018

Вопрос в том, когда использовать индексы или нет. Если у меня есть таблица с 10 миллиардами строк и я имею статус столбца в каждой строке. Я хочу искать строки в зависимости от статуса, поэтому я хочу определить индекс для этого столбца. У нас есть около 5 различных статусов, большинство из которых находятся на 2/3 из них. Тем не менее, когда я читаю эту статью https://docs.datastax.com/en/cql/3.3/cql/cql_using/useWhenIndex.html#useWhenIndex__when-no-index, похоже, что каждый тип статуса будет строкой. Итак, мои вопросы:

1 - этот индекс сможет ссылаться на все эти количества строк?

2- можем ли мы определить индекс для нескольких столбцов?

3 - если статус обновляется с помощью задания на спарк, это задание не должно обновлять более 100 000 ячеек? Означает 100k статусов строк ( LINK )

4 - лучше ли использовать представление для каждого статуса?

...