Меня смущают прогнозирование (например, с фильтром Калмана) и прогнозирование (например, с SGDRegressor или логистической регрессией).
У меня есть набор данных с количеством логинов по часам в течение 1 месяца (МАЙ). Мои переменные: _time и логины.
Я использовал SGDRegressor и сохранил модель (месяц май). Затем я применил сохраненную модель с данными июня (это невидимые данные).
Результаты очень хорошие (я не знаю, если я переоснащение). Но, как я уже сказал. Я запутался в прогнозировании с Кальманом и прогнозировании (одномерном) с SGDRegressor.
Любая помощь, пожалуйста?
FORECASTING WITH KALMAN
Here, I am using 36 hours as test and I am forecasting 36 hours
| inputlookup fortigate_QC_May2019_logins.csv
| fit StandardScaler "logins" with_mean=false with_std=true
| fit DBSCAN "SS_logins"
| where NOT cluster==-1
| predict "SS_logins" as prediction algorithm=LLP5 holdback=36 future_timespan=72 upper95=upper95 lower95=lower95
| `forecastviz(72, 36, "SS_logins", 95)`
PREDICTING WITH SGDREGRESSOR
Here, I am calling a saved model (using MAY) and applying it with JUNE.
| inputlookup fortigate_QC_June2019_logins.csv
| fit StandardScaler "logins" with_mean=false with_std=true
| apply "authentication_profiling_SGDRegressor"
| table _time, "SS_logins", "predicted(SS_logins)"