ValueError с statsmodels OLS - PullRequest
       86

ValueError с statsmodels OLS

0 голосов
/ 03 августа 2020

Я пытаюсь запустить кластерную линейную регрессию с помощью статистических моделей:

import statsmodels.formula.api as smf
mod = smf.OLS("C(cured) ~ Loan_term + Loan_Amount + Loan_APR + Loan_Term + Client_Age + Total_Income", data=df)

и получаю следующую ошибку:

ValueError: endog has evaluated to an array with multiple columns that has shape (17314,2). This occurs when the variable converted to endog is non-numeric (eg. bool or str). 

Пробовал то же самое с меньшим количеством переменных и ничего . Зависимая переменная - фиктивная, поэтому я называю ее категориальной, что, на мой взгляд, нормально, но в любом случае я пробовал без нее, и появляется та же ошибка. Я действительно не знаю, к чему относится эта ошибка. Кто-нибудь знает, что здесь происходит?

1 Ответ

0 голосов
/ 08 августа 2020

Это происходит, если ваш экзог - строка или объект. Убедитесь, что это число c, чтобы Пэтси не интерпретировал его как категориальный вариант, который затем преобразуется в набор пустышек.

...