Мы планируем поместить множество метрических данных в какую-то разновидность nosql db, возможно, cassandra, может быть, что-то еще, на нескольких серверах.
Мы хотим выполнить вычисления для данных в стиле сокращения карты (объединить данные на компьютере, на котором они живут, а затем объединить результаты).
Я сделал POC, используя Cassandra, Hadoop и mapreduce. Затраты на запуск рабочих мест в maprecece и получение результатов оказались слишком высокими для наших нужд.
Прежде чем мы пойдем по-своему, есть ли еще какие-нибудь распределенные Java-фреймворки, которые подчеркивают производительность?