Также я сомневаюсь, что имеющиеся у меня данные могут быть использованы для прогнозирования временных рядов или нет.
Я прилагаю скриншот графика вибрационного рассеяния.
Данные выглядят странно (> 1 значение для некоторых значений по оси X).Зачем разбрасывать?
У меня есть данные о ежедневной вибрации компрессора (около 1500 образцов) и я хочу прогнозировать ее еще на 30 дней.Я пробовал ARIMA, но он дает плохие результаты.
На самом деле, существует несколько подходов для прогнозирования n-значений одновременно:
- Использовать модель «предсказать следующее значение»: сделайте прогноз для следующего шага, затем используйте его, сделайте новый прогноз и так далее.Преимущество здесь: 1 модель.Недостаток: ваша ошибка будет расти очень быстро, потому что ваши ошибки объединяются на каждом шаге.
- Используйте 30 моделей для прогнозирования 30 значений (1 шаг вперед, 2 шага вперед).Это лучше, но тюнинг может занять очень много времени.Как здесь предлагается, https://github.com/facebook/prophet может помочь вам в этом.
- Различные комбинации.
Кстати, есть хороший ответ: https://stats.stackexchange.com/a/354849/183391
Но прежде всего проверьте ваши данные, интерполируйте, если необходимо (в обе стороны), подумайте о nan
(если есть).Как я вижу, вам придется тратить гораздо больше времени на обработку данных, а не на подгонку модели.
И, не забывайте, временные ряды иногда предсказуемы с помощью линейной регрессии и других моделей!По форме сюжета это тоже может быть хорошим подходом!