Я пытаюсь запустить кластерную линейную регрессию с помощью статистических моделей:
import statsmodels.formula.api as smf
mod = smf.OLS("C(cured) ~ Loan_term + Loan_Amount + Loan_APR + Loan_Term + Client_Age + Total_Income", data=df)
и получаю следующую ошибку:
ValueError: endog has evaluated to an array with multiple columns that has shape (17314,2). This occurs when the variable converted to endog is non-numeric (eg. bool or str).
Пробовал то же самое с меньшим количеством переменных и ничего . Зависимая переменная - фиктивная, поэтому я называю ее категориальной, что, на мой взгляд, нормально, но в любом случае я пробовал без нее, и появляется та же ошибка. Я действительно не знаю, к чему относится эта ошибка. Кто-нибудь знает, что здесь происходит?