Я пытаюсь построить модель прогнозирования для данных о доходах, используя SARIMA. У меня есть данные, начиная с 2004 по 2019-сентябрь. Когда я строю данные, мое распределение выглядит следующим образом.
Мой вопрос состоит в том, сколько данных я должен использовать из этого, чтобы иметь смысл прогнозов,Похоже, что данные за первые годы немного неравномерно. Я не уверен, существует ли статистический способ выяснить, можно ли использовать все данные или их необходимо очистить.
В подобных случаях достаточно просто сделать данные стационарнымиразличие достаточно для использования с моделями ARIMA?