Набор данных: набор данных колик, предоставленный UCI
Я пробую различные алгоритмы для классификации, в конце концов, лучшей моделью точности является RandomForest (86%).
Однако, когда я смотрю на показатель TP / FP, я думаю, что показатель FP для класса yes слишком высок (0,235).
Поскольку набор данных относится к медицинским вопросам, а стоимость неправильного суждения выше по сравнению с другими типами данных.
Если я хочу понизить уровень своей FP и улучшить классификацию, есть ли способ сделать это (согласно существующим данным)?
=== Детальная точность по классу ===
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.922 0.235 0.870 0.922 0.895 0.705 0.906 0.924 yes
0.765 0.078 0.852 0.765 0.806 0.705 0.906 0.883 no
Weighted Avg. 0.864 0.177 0.863 0.864 0.862 0.705 0.906 0.909
=== Confusion Matrix ===
a b <-- classified as
214 18 | a = yes
32 104 | b = no