Я знаю, что это может показаться дублирующим вопросом, но я сделал то, что было предложено здесь , но это не сработало. Я работаю с 28 переменными, некоторые из которых являются категориальными, но я отбросил одну из категорий каждой переменной. Как указано в старом вопросе, я определил:
import statsmodels.api as sm
from sklearn.linear_model import LogisticRegression
logit = sm.Logit(y_train, X_train)
clf = LogisticRegression(C=1e8,fit_intercept=False)
clf.fit(X_train, y_train)
А затем, когда я проверяю свои результаты, в sm
моя логарифмическая вероятность составляет -19661. В sklearn
мой log_loss равен 1,9. В sm
мои коэффициенты составляют от -1,38 до 1,98. В sklearn
они варьируются от -0,01 до 0,02. Мне нужно, чтобы мои результаты были более похожими, чтобы я мог сделать вывод о своих результатах. Что может случиться? Чего мне не хватает?
Спасибо.