Как размер наборов данных влияет на точность ARIMA-прогнозирования? - PullRequest
0 голосов
/ 27 июня 2019

Я получил набор данных с около 15000 записей. Он забирает свободную память сервера каждые 10 минут и каждую ночь занимает больше места, а раз в месяц - очень мало. Если я разделю эти данные на ~ 75% traindata и захочу спрогнозировать остальные 25%, прогноз получит прямую линию / будет одинаковым для каждого шага прогнозирования (примерно в середине данных поезда), даже если данные поезда имеют очень специфическая картина. Таким образом, прогнозирование даже не чередуется.

Вы знаете, почему это могло произойти? Я пробовал много разных моделей, включая модели SARIMA, и все это не помогает. Может ли быть так, что 15000 точек данных слишком велики для аримы, так что они не могут с этим справиться? На этой картинке вы можете увидеть прогноз в сравнении с фактическими данными: https://www.dropbox.com/s/0v6wdtselrspqd8/Capture.PNG?dl=0

Я был бы так счастлив, если бы кто-то мог сказать мне, что случилось! :)

1 Ответ

0 голосов
/ 01 июля 2019

Я думаю, что ваши данные не содержат какой-либо сильной сезонности и тренда, и поэтому arima () не может найти точный прогноз из-за этого.

Поэтому просто берется среднее значение ваших исторических данных и возвращается какпрогноз.следовательно, значения одинаковы (вы получите прямую линию при построении графика).

...