Мера F1 против точности для сравнения двух моделей - PullRequest
0 голосов
/ 09 июля 2019

Как я понимаю, точность не является хорошей мерой для сравнения производительности двух моделей, когда данные несбалансированы, а показатель F1 лучше, чем в этом случае, поэтому я пытаюсь найти пример для двух моделей, где модель Алучше, чем модель B, но точность B больше, чем точность A, в то время как F1 для A больше, чем F1 для B. Есть ли такой случай?если нет, пожалуйста, скажите мне, почему, и если да, приведите пример.

Ответы [ 2 ]

1 голос
/ 13 июля 2019

Не могли бы вы предоставить немного больше информации об истории вопроса?Какие модели вы сравниваете, на что похож набор данных?

Действительно, сравнения точности может быть недостаточно.Я написал сообщение в блоге некоторое время назад о Сравнении моделей ML, вы можете проверить его.

0 голосов
/ 09 июля 2019

Просто используйте любой несбалансированный набор данных из хранилища UCI или Kaggle.Одним из хороших наборов данных для этого будет набор данных о мошенничестве с кредитными картами или любой набор данных о раке, которые доступны в обоих репозиториях.Эти наборы данных дадут вам хорошую точность 99,99% и плохой результат F1, если вы обучены без какой-либо обработки, чтобы справиться с дисбалансом между классами.

Набор данных кредитной карты

Набор данных рака

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...