Оценка производительности модели является одним из наиболее важных этапов любого проектного цикла машинного обучения и должна выполняться эффективно. Поскольку вы упомянули, что используете для оценки метрики точности и заблуждения. Я хотел бы добавить несколько моментов для разработки лучшей стратегии оценки:
Предположим, вы разрабатываете классификатор, который классифицирует EMAIL как СПАМ или НЕ СПАМ (HAM), теперь одним из возможных критериев оценки может быть ЛОЖНО ПОЛОЖИТЕЛЬНАЯ СТАВКА , потому что это может быть очень неприятно, если электронное письмо, не относящееся к спаму, заканчивается в категории спама (что означает, что вы прочтете ценное письмо).
Итак, я рекомендую вам учитывать метрики, основанные на по проблеме, на которую вы нацелены. Существует множество показателей, таких как оценка F1, отзыв, точность, которые вы можете выбрать в зависимости от проблемы, с которой столкнулись.
Вы можете посетить: https://medium.com/apprentice-journal/evaluating-multi-class-classifiers-12b2946e755b для лучшего понимания.