Как выбрать оптимальный объем данных для прогнозирования временных рядов? - PullRequest
0 голосов
/ 17 октября 2019

Я пытаюсь построить модель прогнозирования для данных о доходах, используя SARIMA. У меня есть данные, начиная с 2004 по 2019-сентябрь. Когда я строю данные, мое распределение выглядит следующим образом.

Revenue vs Time

Мой вопрос состоит в том, сколько данных я должен использовать из этого, чтобы иметь смысл прогнозов,Похоже, что данные за первые годы немного неравномерно. Я не уверен, существует ли статистический способ выяснить, можно ли использовать все данные или их необходимо очистить.

В подобных случаях достаточно просто сделать данные стационарнымиразличие достаточно для использования с моделями ARIMA?

...