Я хотел бы суммировать скользящие средние для ряда различных категорий при хранении записей журнала. Представьте себе сервис, который сохраняет журналы веб-сервера по одной записи за раз. Давайте представим, что у нас нет доступа к зарегистрированным записям. Таким образом, мы видим их один раз, но позже не имеем к ним доступа.
Для разных страниц хотелось бы знать
- общее количество попаданий (просто)
- «последнее» среднее (например, около месяца)
- среднее «долгосрочное» (более года)
Существует ли какой-нибудь умный алгоритм / модель данных, которая позволяет сохранять такие скользящие средние без необходимости пересчитывать их путем суммирования огромных объемов данных?
Мне не нужен точный средний (ровно 30 дней или около того), а только трендовые индикаторы. Так что некоторая нечеткость не является проблемой вообще. Следует просто убедиться, что новые записи имеют больший вес, чем более старые.
Одним из решений, вероятно, было бы автоматическое создание статистических записей за каждый месяц. Тем не менее, мне даже не нужна статистика за последний месяц, так что это похоже на излишество. И это не даст мне скользящее среднее, а скорее переключит на новые значения из месяца в месяц.