Как работать с данными временных рядов с большим количеством нулей? - PullRequest
1 голос
/ 19 июня 2020

У меня есть данные временного ряда от 0 до 30 миллионов. Его в основном веб-трафик c еженедельные данные. Я работаю над построением модели прогнозирования на основе этих данных. Я хочу понять, как я могу работать с этим диапазоном данных. Я пробовал трансформацию коробки Кокса с моделью пророка. Я не уверен, какие показатели я могу использовать для оценки производительности модели. В данных много нулей. Я не могу удалить их из набора данных. Есть ли лучший способ справиться с 0, кроме преобразования Бокса Кокса? У меня были проблемы с обратным преобразованием, но я добавил к данным небольшое значение (0,1), чтобы избежать отрицательных значений.

1 Ответ

0 голосов
/ 19 июня 2020

Если в вашем ряду много периодов c нулевых данных, Метод Кростона является односторонним. Это в основном стратегия прогнозирования для продуктов с непостоянным спросом. Также вы можете попробовать экспоненциальное сглаживание и традиционный ARIMA. , SARIMA моделирует и отсекает отрицательные значения в прогнозе (это соответствует вашему варианту использования). вы можете найти метод Croston в пакете forecast.

также обратитесь по этим ссылкам.

https://stats.stackexchange.com/questions/8779/analysis-of-time-series-with-many-zero-values/8782 https://stats.stackexchange.com/questions/373689/forecasting-intermittent-demand-with-zeroes-in-times-series https://robjhyndman.com/papers/foresight.pdf

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...