Прогнозирование временных рядов: нужна помощь в использовании рядов с разными периодами дней - PullRequest
1 голос
/ 28 мая 2019

Это событие, которое проводит моя организация, и у нас есть исторические данные о продажах билетов за 2016, 2017, 2018. Эти данные содержат количество проданных билетов за день, учитывая весь период продаж.

В связи с этим событием 2019 года меня попросили сделать прогноз количества билетов, проданных за день, с учетом всего периода продаж, что-то вроде того, чтобы провести нас через этот период, то есть у нас будет информация, если мы выше или ниже ожидаемых средних продаж.

Проблема в том, что исторические данные имеют различный размер периода продаж в днях:

В 2016 году общий период продаж составил 46 дней. В 2017 году 77 дней. В 2018 году 113 дней.

В 2019 году мы планируем 85 дней. Итак, как мне отрегулировать эти исторические данные логическим / статистическим способом, чтобы я мог использовать их в качестве входных данных для статистической прогностической модели (такой как модель ARIMA)?

Кроме того, я планирую сделать это на Python, поэтому, если у вас есть какие-либо предложения по этому поводу, я бы тоже хотел их услышать!

Спасибо!

1 Ответ

0 голосов
/ 28 мая 2019

Исходя из того, что я понимаю после прочтения вашего вопроса, я подхожу к этой проблеме следующим образом.

  • Для каждого дня определяйте, насколько далеко событие от этого дня.Максимальное значение для этого числа составляет 46 в 2016 году, 77 в 2017 году и т. Д. Масштабируйте это значение по максимальному дню.

  • Используйте указанную выше переменную вместе с днем ​​месяца, днемнеделю и т. д. как посторонняя переменная

  • Кроме того, используйте информацию о задержке от продажи билетов.Вы можете попробовать один день, один день и т. Д.

  • Вы сможете сгенерировать все эти данные от начала продажи до конца.

  • Используйте сгенерированные переменные в качестве предиктора для каждого дня и используйте продажи билетов в качестве целевой переменной и создайте модель машинного обучения вместо прогнозирования.

  • Используйте модель машинного обучения вместе с сгенерированными переменными дляпрогнозировать будущие продажи.

...