Почему я получаю совершенно разные результаты между statsmodels и логистической регрессией sklearn - PullRequest
0 голосов
/ 30 октября 2019

Я знаю, что это может показаться дублирующим вопросом, но я сделал то, что было предложено здесь , но это не сработало. Я работаю с 28 переменными, некоторые из которых являются категориальными, но я отбросил одну из категорий каждой переменной. Как указано в старом вопросе, я определил:

import statsmodels.api as sm
from sklearn.linear_model import LogisticRegression

logit = sm.Logit(y_train, X_train)

clf = LogisticRegression(C=1e8,fit_intercept=False)
clf.fit(X_train, y_train)

А затем, когда я проверяю свои результаты, в sm моя логарифмическая вероятность составляет -19661. В sklearn мой log_loss равен 1,9. В sm мои коэффициенты составляют от -1,38 до 1,98. В sklearn они варьируются от -0,01 до 0,02. Мне нужно, чтобы мои результаты были более похожими, чтобы я мог сделать вывод о своих результатах. Что может случиться? Чего мне не хватает?

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...