Я применяю логистические машины c регрессии и опорных векторов к точно такому же набору данных с 70% данных для обучения и 30% для теста. Оба выполняют одинаково, имеют одинаковую точность, отзыв, f1-счет и путаницу. Матрицу путаницы и отчет о классификации для обоих можно увидеть ниже.
[1180 0]
[ 17 0]]
precision recall f1-score support
0 0.99 1.00 0.99 1180
1 0.00 0.00 0.00 17
accuracy 0.99 1197
macro avg 0.49 0.50 0.50 1197
weighted avg 0.97 0.99 0.98 1197
Я применил 10-кратную перекрестную проверку и к обеим моделям, и обе достигли одинаковой средней точности 98,57%, обе не достигли истинных положительных результатов по всем все 10 сгибов, также имеют одинаковое количество TP, TN, FP, FN в каждом из 10-кратных
Однако проблема заключается в том, что когда я вычисляю область ro c под значениями кривой, они отличаются как см. ниже:
Logistic Regression: 0.86
Support Vector Machines: 0.23
Эти значения указывают на то, что регрессия логистики c намного лучше по сравнению с машинами опорных векторов, хотя матрица путаницы и отчет о классификации одинаковы. Я действительно запутался, так как все остальные результаты указывают одинаково производительность по обеим моделям ?? Может кто-нибудь, пожалуйста, помогите, почему оба получают разные значения ro c, тогда как все остальное одинаково.