Почему область значений RO C под кривой двух моделей различна, тогда как точность, точность, отзыв, f1-оценка и матрица путаницы одинаковы - PullRequest
0 голосов
/ 23 февраля 2020

Я применяю логистические машины c регрессии и опорных векторов к точно такому же набору данных с 70% данных для обучения и 30% для теста. Оба выполняют одинаково, имеют одинаковую точность, отзыв, f1-счет и путаницу. Матрицу путаницы и отчет о классификации для обоих можно увидеть ниже.

           [1180    0]
           [  17    0]]

          precision    recall  f1-score   support

       0       0.99      1.00      0.99      1180
       1       0.00      0.00      0.00        17

accuracy                               0.99      1197
macro avg          0.49      0.50      0.50      1197
weighted avg       0.97      0.99      0.98      1197

Я применил 10-кратную перекрестную проверку и к обеим моделям, и обе достигли одинаковой средней точности 98,57%, обе не достигли истинных положительных результатов по всем все 10 сгибов, также имеют одинаковое количество TP, TN, FP, FN в каждом из 10-кратных

Однако проблема заключается в том, что когда я вычисляю область ro c под значениями кривой, они отличаются как см. ниже:

Logistic Regression: 0.86
Support Vector Machines: 0.23

Эти значения указывают на то, что регрессия логистики c намного лучше по сравнению с машинами опорных векторов, хотя матрица путаницы и отчет о классификации одинаковы. Я действительно запутался, так как все остальные результаты указывают одинаково производительность по обеим моделям ?? Может кто-нибудь, пожалуйста, помогите, почему оба получают разные значения ro c, тогда как все остальное одинаково.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...