Как справиться с низким уровнем ложных срабатываний или улучшить путаницу - PullRequest
0 голосов
/ 12 апреля 2019

Набор данных: набор данных колик, предоставленный UCI

Я пробую различные алгоритмы для классификации, в конце концов, лучшей моделью точности является RandomForest (86%). Однако, когда я смотрю на показатель TP / FP, я думаю, что показатель FP для класса yes слишком высок (0,235). Поскольку набор данных относится к медицинским вопросам, а стоимость неправильного суждения выше по сравнению с другими типами данных.

Если я хочу понизить уровень своей FP и улучшить классификацию, есть ли способ сделать это (согласно существующим данным)?

=== Детальная точность по классу ===

                 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
                 0.922    0.235    0.870      0.922    0.895      0.705    0.906     0.924     yes
                 0.765    0.078    0.852      0.765    0.806      0.705    0.906     0.883     no
Weighted Avg.    0.864    0.177    0.863      0.864    0.862      0.705    0.906     0.909 



=== Confusion Matrix ===

   a   b   <-- classified as
 214  18 |   a = yes
  32 104 |   b = no
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...