Вы можете выполнить сканирование с использованием фильтра предикатов - который является довольно универсальным (вы можете даже сделать регулярное выражение) или запрос вторичного индекса, который учитывает только фильтр равенства для строк.
Сканирования более надежны и будут еще лучше в следующем выпуске (март / апрель 2020 г.) с точки зрения управления их прогрессом. При сканировании необходимо сначала прочитать все записи с диска, а затем применить фильтр.
SI будет быстрее, потому что вы фильтруете (вторичный индекс в памяти) перед извлечением записи с диска, но менее надежен, если нижележащие узлы кластера не являются стабильными - то есть, если вы потеряете или добавите узел во время запроса SI. Запрос выполняется параллельно на всех узлах кластера и передает результаты обратно клиенту в произвольном порядке. Вы можете уменьшить это, используя опцию «failOnClusterChange» и перезапуская, когда кластер стабилен. (Сканирования также имеют такую же опцию.)
Что лучше? сделать A / B тест по вашей конкретной проблеме c.