У меня есть приложение, которое требует аналитики для другого уровня агрегации, и это рабочая нагрузка OLAP. Я тоже хочу обновлять свою базу данных довольно часто.
например, вот как выглядит мое обновление (схема выглядит так: время, назначение, исходный ip, браузер -> посещения)
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
И затем я хочу спросить, каково общее количество посещений www.stackoverflow.com из браузера Firefox в прошлом месяце.
Я понимаю, что система Vertica может сделать это относительно дешево (с точки зрения производительности и масштабируемости, но, вероятно, не с точки зрения затрат). У меня здесь два вопроса.
1) Существует ли продукт с открытым исходным кодом, на котором я могу построить эту проблему? В частности, насколько хорошо работает система Мондриана? (масштабируемость и производительность)
2) Существует ли базовое решение HBase или Hypertable (очевидно, голый HBase / Hypertable не может этого сделать) для этого? - но если есть проект, основанный на HBase / Hypertable, масштабируемость, вероятно, не будет проблемой IMO)?
Спасибо!