Как можно выбрать различное количество в Кассандре? - PullRequest
1 голос
/ 28 сентября 2019

Мне нужно выбрать различное количество в таблице в Кассандре.

Как я понимаю, прямое различное количество не поддерживается в Кассандре, даже вложенные запросы, такие как rdbms.

select count(*) from (select distinct key_part_one from stackoverflow_composite) as count;

SyntaxException: строка 1:21 нет жизнеспособной альтернативы при вводе '(' (выберите количество (*) из [(] ...)

Как получить его. Могу ли я получить напрямуюот cassandra или каких-либо дополнительных инструментов / языков, которые нужно использовать?

ниже мое утверждение создания таблицы.

CREATE TABLE nishant_ana.ais_profile_table (
    profile_key text,
    profile_id text,
    last_update_day date,
    last_transaction_timestamp timestamp,
    last_update_insertion_timestamp timeuuid,
    profile_data blob,
    PRIMARY KEY ((profile_key, profile_id), last_update_day)
) WITH CLUSTERING ORDER BY (last_update_day DESC)
    AND bloom_filter_fp_chance = 0.01
    AND caching = {'keys': 'ALL', 'rows_per_partition': 'NONE'}
    AND comment = ''
    AND compaction = {'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32', 'min_threshold': '4'}
    AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'}
    AND crc_check_chance = 1.0
    AND dclocal_read_repair_chance = 0.1
    AND default_time_to_live = 0
    AND gc_grace_seconds = 864000
    AND max_index_interval = 2048
    AND memtable_flush_period_in_ms = 0
    AND min_index_interval = 128
    AND read_repair_chance = 0.0
    AND speculative_retry = '99PERCENTILE';

Я только начал использовать cassandra.

1 Ответ

0 голосов
/ 28 сентября 2019

Из Кассандры вы можете сделать только select distinct partition_key from ....

Если вам нужно что-то подобное, вы можете использовать Spark + Spark Cassandra Connector - он будет работать, но неожидайте ответы в режиме реального времени, так как необходимо прочитать необходимые данные со всех узлов, а затем вычислить ответ.

...