Кассандра считать уникальные значения в таблице? - PullRequest
0 голосов
/ 24 октября 2018

Я уже некоторое время осматриваюсь, но не смог найти способ подсчета уникальных значений для таблицы в Кассандре?Я знаю функцию подсчета COUNT (*), но, поскольку в таблице слишком много записей, она всегда истекает со следующим сообщением об ошибке:

ERROR MESSAGE

ReadTimeout: Error from server: code=1200 [Coordinator node timed out waiting for 
replica nodes' responses] message="Operation timed out - received only 1 responses." 
info={'received_responses': 1, 'required_responses': 1, 'consistency': 'ONE'}

ПРОБЛЕМА

У меня более 70 000 записей, хранящихся в таблице, но есть дубликаты, поскольку с каждой из этих записей связаны разные даты.Но независимо от этих дат, я хочу иметь возможность подсчитать, сколько уникальных идентификаторов записей у меня есть.Есть ли какой-нибудь сценарий или способ сделать это без?

Честно говоря, логика даже помогла бы, так как я очень новичок в Cassandra 3.0 и Python 2.7, поэтому я не уверен, что лучший подход будет делать это?

Спасибо!

...