sklearn LogisticRegression - доказательство того, что модель не может быть улучшена - PullRequest
0 голосов
/ 18 апреля 2019

Я пытаюсь настроить свою модель логистической регрессии в sklearn.Я использую F балл, чтобы проверить балл модели.Вот основная идея:

clf = LogisticRegression()

parameters = {
    'solver': ['newton-cg', 'lbfgs', 'liblinear', 'sag', 'saga'],
    'max_iter': [100, 200, 300],
    'C': [0.001, 0.01, 0.1, 1, 10, 100, 1000]
}

scorer = make_scorer(fbeta_score, beta=2)

grid_obj = GridSearchCV(clf, parameters, scoring=scorer, verbose=True)

Кроме того, я пытался сохранить единственные решатели, которые поддерживают штрафы l1 и l2.
В итоге я получил результаты:

Unoptimized model
------
Accuracy score on testing data: 0.8419
F-score on testing data: 0.6832

Optimized Model
------
Final accuracy score on the testing data: 0.8418
Final F-score on the testing data: 0.6828

Кажется, что установка модели по умолчанию дает лучшие результаты.Я признаю, что это может быть.Но я ищу любое объяснение, почему так?Есть ли какая-нибудь статья или статья, которая дает вам более подробное представление о ней и объясняет, почему ваша модель логистической регрессии не может работать лучше с некоторыми доказательствами, поступающими из вашего набора данных поезда?

...