линейная регрессия с фиктивной зависимой переменной - PullRequest
0 голосов
/ 04 августа 2020

У меня есть набор данных, в котором моя интересующая меня переменная - фиктивная, и я хотел бы сделать для нее линейную регрессию. Однако, когда я использую «формулу R-стиля» в statsmodels OLS, это дает мне ошибку.

Это код, который я использую:

mod = smf.ols("C(cured) ~ Loan_Term + Loan_Amount", data=df)
result = mod.fit()

Но даже когда Я запускаю первую строку, ошибка говорит следующее:

ValueError: endog has evaluated to an array with multiple columns that has shape (17314,2). This occurs when the variable converted to endog is non-numeric (eg. bool or str). 

Пробовал использовать Loan_Amount в качестве зависимой переменной, просто чтобы увидеть, была ли проблема во всем моем наборе данных, и это сработало .. поэтому я предполагаю проблему с зависимой переменной фиктивной? Можно ли это решить?

Также пробовал с обычным способом выполнения регрессии:

mod = sm.OLS(Y,X)

и это работает ...

Есть идеи?

...