Я получил набор данных с около 15000 записей. Он забирает свободную память сервера каждые 10 минут и каждую ночь занимает больше места, а раз в месяц - очень мало.
Если я разделю эти данные на ~ 75% traindata и захочу спрогнозировать остальные 25%, прогноз получит прямую линию / будет одинаковым для каждого шага прогнозирования (примерно в середине данных поезда), даже если данные поезда имеют очень специфическая картина. Таким образом, прогнозирование даже не чередуется.
Вы знаете, почему это могло произойти? Я пробовал много разных моделей, включая модели SARIMA, и все это не помогает. Может ли быть так, что 15000 точек данных слишком велики для аримы, так что они не могут с этим справиться?
На этой картинке вы можете увидеть прогноз в сравнении с фактическими данными: https://www.dropbox.com/s/0v6wdtselrspqd8/Capture.PNG?dl=0
Я был бы так счастлив, если бы кто-то мог сказать мне, что случилось! :)