почему Cassandra не поддерживает внутренние функции агрегирования
Cassandra поддерживает функции агрегации по запросу (как пользовательские в java, python, javascript и некоторых готовых), которые при использовании на одномраздел работает в определенных пределах.Помня о том, что эти запросы действительно рассчитаны на ответы в течение нескольких миллисекунд, тем не менее то, что вычисляет среднее значение из миллиона значений, не будет работать должным образом при частых запросах.
Агрегации нельзя легко поддерживать в актуальном состоянии, так какудаляет (особенно сложно в распределенной среде, так как удаление может даже не наблюдаться на всех узлах - помните, что Cassandra - это AP, а не CP), и данные ttl'd истекают, поэтому весь набор для агрегирования должен быть пересчитан и отправлен с уровня согласованностиколичество реплик координатору для расчета.Таким образом, хотя данные раздела хранятся последовательно на диске для некоторого числа sstables и могут быть объединены довольно эффективно, они все равно могут быть дорогостоящими для координатора, и если их выполнить в диапазоне, объем данных, передаваемых и вычисляемых, может закончиться сбоем(тайм-аут) легко.