Я строю систему для анализа больших объемов финансовых данных, касающихся цен на ценные бумаги.Большой проблемой в этом является определение того, какой метод хранения использовать для данных, учитывая, что данные будут в десятках террабайт.Будет много запросов к данным, таким как получение средних значений, вычисление стандартных отклонений и сумм, отфильтрованных по нескольким столбцам, таким как цена, время, объем и т. Д. Операторы объединения не являются обязательными, но было бы неплохо иметь их.
В данный момент я ищу ознакомительные выпуски сообщества infobright, monetdb и greenplum.Пока они кажутся великолепными, но для более сложных функций некоторые из них требуются, недоступны в некоторых из этих выпусков (с использованием нескольких серверов, операторов вставки / обновления и т. Д.).
Какие решения вы бы использовали дляэта ситуация и преимущества она дает по сравнению с альтернативами?Быть экономически эффективным является основным плюсом.Если я должен буду заплатить за решение для хранилища данных, я это сделаю, но я бы предпочел избежать его и, если это возможно, пойти по пути открытого исходного кода / сообщества.