Вот еще одна идея:
Если вы можете объединить просмотры страниц и использование памяти по значениям отметки времени, вы можете сформировать таблицу, подобную этой
Страница A | Страница B | Страница C | Страница D | Страница E | .... | Memory_use
Значение для каждого из столбцов страницы может быть битом [0,1], показывая, была ли страница запрошена или нет, или количество страниц, в зависимости от ваших данных. В столбце Memory_use вы можете указать соответствующие пропорции загрузки памяти или количество в МБ. Таким образом, Memory_use можно рассматривать как зависимую переменную и страницы как пояснительные. Таким образом, вы можете подобрать подходящую (в зависимости от формы зависимой переменной) обобщенную линейную модель для этого набора данных. Результаты этого анализа помогут вам понять следующее
- Какие страницы существенно влияют на стоимость использования памяти
-Сколько вклад каждой страницы в нагрузку (по коэффициенту в модели)
-Возможность того, что другие факторы, не измеренные, играют значительную роль в загрузке памяти (чрезмерное рассеяние), при худшем случае, когда все переменные предиктора могут оказаться неважными.