У меня есть набор данных, в котором моя интересующая меня переменная - фиктивная, и я хотел бы сделать для нее линейную регрессию. Однако, когда я использую «формулу R-стиля» в statsmodels
OLS, это дает мне ошибку.
Это код, который я использую:
mod = smf.ols("C(cured) ~ Loan_Term + Loan_Amount", data=df)
result = mod.fit()
Но даже когда Я запускаю первую строку, ошибка говорит следующее:
ValueError: endog has evaluated to an array with multiple columns that has shape (17314,2). This occurs when the variable converted to endog is non-numeric (eg. bool or str).
Пробовал использовать Loan_Amount
в качестве зависимой переменной, просто чтобы увидеть, была ли проблема во всем моем наборе данных, и это сработало .. поэтому я предполагаю проблему с зависимой переменной фиктивной? Можно ли это решить?
Также пробовал с обычным способом выполнения регрессии:
mod = sm.OLS(Y,X)
и это работает ...
Есть идеи?