Модель для анализа временных рядов - PullRequest
0 голосов
/ 04 ноября 2018

Мне было просто интересно узнать, есть ли у нас модель, которая учитывает оба фактора для прогнозирования временных рядов (например, прогнозирование будущих продаж).

Проблема в том, что если мы используем что-то вроде ARIMA, то оно не учитывает важную информацию (например, новые акции, добавленные Компанией, или могут быть другие факторы, такие как тип продукта и т. Д.).

А с другой стороны, если я использую модели машинного обучения, такие как Случайные леса, я теряю информацию о тенденциях и сезонности.

Есть ли у нас что-то, что объединяет оба из них?

1 Ответ

0 голосов
/ 05 ноября 2018

Модели ARIMA могут получать дополнительную информацию помимо самих данных временного ряда. Это так называемые причинные или экзогенные переменные. Смотрите модели ARMAX и ARIMAX.

Немного сложнее с моделями типа экспоненциального сглаживания (Холт, Холт-Винтерс и т. Д.).

Модели машинного обучения можно использовать и для данных временного ряда, вам просто нужно правильно отформатировать данные.

Для традиционной модели временного ряда данные выглядят так:

Train              Test 
[1, 2, 3],          [4]
[1, 2, 3, 4],       [5]
[1, 2, 3, 4, 5],    [6]
[1, 2, 3, 4, 5, 6], [7]

Вы можете переформатировать данные так, чтобы они выглядели как контролируемая проблема обучения:

Train:    [1, 2, 3 | 4]
          [2, 3, 4 | 5]
          [3, 4, 5 | 6]
-----------------------
Test:     [4, 5, 6 | 7]

Вы можете применять большинство контролируемых методов ОД. Однако обратите внимание, что для моделей ML ввод временных рядов всегда будет фиксированным числом лагов (по сравнению с последовательными моделями, такими как экспоненциальное сглаживание).

...