Вместе с коллегой в настоящее время мы обсуждаем, какие показатели эффективности следует выбрать для алгоритма классификации.
Например, я знаю, что точность не должна использоваться в одиночку из-за существующего парадокса (https://tryolabs.com/blog/2013/03/25/why-accuracy-alone-bad-measure-classification-tasks-and-what-we-can-do-about-it/)
Является ли наилучшим подходом использование многих из них (точность, отзыв, чувствительность, специфичность, F-мера, точность, площадь под кривой ROC и / или каппа) и делать индивидуальные интерпретации?
Или есть какой-то показатель, который лучше других?