Я пытаюсь обучить модель линейной регрессии с помощью перехвата, используя библиотеку statsmodels.api
(потому что с этим я могу получить сводку с параметрами sgnificance).
К сожалению, этот метод не работает
X_train_2 = sm.add_constant(X_train)
Поэтому я пытаюсь вручную добавить 1 вектор-стоант в мой набор данных X_train, выполнив следующее:
const = pd.Series([1]*1460, name='const')
X_train_2 = pd.concat([const , X_train ] , axis=1)
model_sm_1 = sm.OLS(Y_train , X_train_2 ).fit()
но снова появляется ошибка:
Файл "C: \ Users \ myname \ Anaconda3 \ lib \ site-packages \ statsmodels \ base \ data.py", строка 133, в _handle_constant
поднять MissingDataError ('exog содержит inf или nans')
MissingDataError: exog содержит inf или nans
У меня вопрос 2:
1) как я могу исправить эту ошибку
2) существует ли другая библиотека для линейной регрессии, которая дает сводную таблицу? (sklearn не дает мне этого)