Выбор модели линейной регрессии для прогнозирования данных временных рядов - PullRequest
0 голосов
/ 16 ноября 2018

У меня есть сигнал и я хочу предсказать y, который представляет количество запросов, используя регрессионные модели. В настоящее время я использую модель регрессии OLS для прогнозирования y. Но ошибка предсказания очень высока, так как мой сигнал имеет много вариаций (взлеты и падения), как показано ниже.

Я заметил, что моя модель большую часть времени переоценивает y (количество запросов), особенно если прогнозируемым точкам предшествует большое значение y. Как указано ниже в желтом и красном круге.

enter image description here

Так что я не уверен, есть ли надежные регрессионные модели для решения этой проблемы большого количества вариаций в моих наборах данных. Также есть ли способ сегментировать эти большие значения, адаптируя размер окна таким образом, чтобы он не включал эти значения?

Не могли бы вы посоветовать

1 Ответ

0 голосов
/ 02 марта 2019

Из визуализации ошибки я бы сказал, что линейная модель не подходит, и вам следует рассмотреть возможность использования чего-то, что обрабатывает периодические данные, а также скользящее среднее - ваши данные, как представляется, содержат периодические элементы и элемент скользящего среднего, который выходит за рамкичто-то "линейное".Рассмотрим что-то вроде Аримы.Вот ссылка на учебник по ARIMA: https://machinelearningmastery.com/arima-for-time-series-forecasting-with-python/ Пожалуйста, опубликуйте результаты:)

Vishaal

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...