Я смотрю на создание системы для управления и отчетности статистики по производительности веб-страниц. Я буду собирать намного больше статистики, чем доступно в стандартных форматах журналов (около 20 метрик), но по сравнению с большинством типов приложений баз данных, базовая структура данных будет очень простой. Моя проблема в том, что я буду накапливать много данных - в районе 100 000 записей (то есть наборов метрик) в час.
Конечно, ресурсы очень ограничены!
Чтобы можно было разумно взаимодействовать с данными, мне нужно было бы объединить каждую метрику в одну минуту, с разбивкой по URL, затем для чего-то более чем на 1 день, объединить в 10-минутные ячейки, затем в 1 неделя, почасовые корзины.
На начальном этапе я хочу предоставить представление (предпочтительно в виде графиков) последнего часа данных, с возможностью для пользователей пролистывать / опускать определенные иерархии URL-адресов (которые не всегда отображаются непосредственно на иерархия, выраженная в пути URL) и для просмотра различных временных периодов.
Вместо того чтобы самому кодировать все это и использовать реляционную базу данных, мне было интересно, есть ли доступные инструменты, которые облегчили бы как управление данными, так и составление отчетов.
Я посмотрел на Мондриана , однако из документации, которую я посмотрел, не видно, можно ли отбросить более детальную информацию при сохранении консолидированных представлений данных.
RRDTool выглядит многообещающе с точки зрения управления консолидацией данных, но выглядит довольно ограниченным с точки зрения запроса набора данных в качестве многомерной / реляционной базы данных.
На что еще мне смотреть?