В терминах sql мы храним такие данные:
table events (
id
timestamp
dimension1
dimension2
dimension3
etc.
)
Все значения измерений являются целыми числами. Эта таблица становится очень большой.
Мы хотим тупо быстрое чтение для таких запросов:
SELECT dimension1, dimension2, COUNT(*)
FROM events
WHERE dimension8 = 'foo'
AND dimension9 = 'bar'
GROUP BY 1, 2
Мы хотим быстрой записи, и нам не нужны транзакции и последовательность. Мы заботимся о возможной доступности и допустимости разделов.
Я искал альтернативы "NoSQL". Может ли Касандра делать запросы, которые я ищу ?? Это не сразу видно из чтения их документов ... если это можно сделать, какова производительность для этих типов запросов?
Также смотрел на MongoDB, но их функция "group ()", насколько я мог прочитать, имеет серьезные ограничения (максимум 10000 строк).
У вас есть опыт работы с какой-либо из этих баз данных, и вы бы порекомендовали ее как решение описанной выше проблемы?
Существуют ли какие-либо другие базы данных, которые я должен рассмотреть, чтобы они могли быстро выполнять подобные запросы?
Ура,
отмычка