Я создаю python скрипт для прогнозирования значений на 30 дней. У меня есть dataframe с именем group_by_day, со столбцами day и pm25, значения которых я хочу предсказать. Я разделил данные, используя scikit train_test_split. Я тренирую модель с использованием сплайна регрессии, но я также не знаю, как прогнозировать значения для тестовых данных. Я снабдил модель данными поезда, но я не знаю, как предсказать значения. До сих пор мне удалось предсказать значения только для данных о поездах, что можно увидеть в следующем коде:
transformed_x1 = dmatrix(
"bs(group_by_df['day'][:len(X_train)], knots=(percentile_25,percentile_50,percentile_75), degree=5, include_intercept=False)",
{"group_by_df['day'][:len(X_train)]": group_by_df['day'][:len(X_train)]}, return_type='dataframe')
fit_spline = sm.GLM(group_by_df['pm25'][:len(X_train)], transformed_x1).fit()
pred_spline = fit_spline.predict(transformed_x1)