Я пытаюсь настроить свою модель логистической регрессии в sklearn.Я использую F балл, чтобы проверить балл модели.Вот основная идея:
clf = LogisticRegression()
parameters = {
'solver': ['newton-cg', 'lbfgs', 'liblinear', 'sag', 'saga'],
'max_iter': [100, 200, 300],
'C': [0.001, 0.01, 0.1, 1, 10, 100, 1000]
}
scorer = make_scorer(fbeta_score, beta=2)
grid_obj = GridSearchCV(clf, parameters, scoring=scorer, verbose=True)
Кроме того, я пытался сохранить единственные решатели, которые поддерживают штрафы l1
и l2
.
В итоге я получил результаты:
Unoptimized model
------
Accuracy score on testing data: 0.8419
F-score on testing data: 0.6832
Optimized Model
------
Final accuracy score on the testing data: 0.8418
Final F-score on the testing data: 0.6828
Кажется, что установка модели по умолчанию дает лучшие результаты.Я признаю, что это может быть.Но я ищу любое объяснение, почему так?Есть ли какая-нибудь статья или статья, которая дает вам более подробное представление о ней и объясняет, почему ваша модель логистической регрессии не может работать лучше с некоторыми доказательствами, поступающими из вашего набора данных поезда?