добавление стоимости вручную вызывает MissingDataError - PullRequest
1 голос
/ 04 июля 2019

Я пытаюсь обучить модель линейной регрессии с помощью перехвата, используя библиотеку statsmodels.api (потому что с этим я могу получить сводку с параметрами sgnificance).

К сожалению, этот метод не работает

X_train_2 = sm.add_constant(X_train)

Поэтому я пытаюсь вручную добавить 1 вектор-стоант в мой набор данных X_train, выполнив следующее:

const = pd.Series([1]*1460, name='const')


X_train_2 = pd.concat([const , X_train  ] , axis=1)

model_sm_1 = sm.OLS(Y_train , X_train_2  ).fit()

но снова появляется ошибка:

Файл "C: \ Users \ myname \ Anaconda3 \ lib \ site-packages \ statsmodels \ base \ data.py", строка 133, в _handle_constant поднять MissingDataError ('exog содержит inf или nans')

MissingDataError: exog содержит inf или nans

У меня вопрос 2:

1) как я могу исправить эту ошибку 2) существует ли другая библиотека для линейной регрессии, которая дает сводную таблицу? (sklearn не дает мне этого)

...