В настоящее время я выполняю мультиклассификацию с 3 классами результатов (A, B и C). В моем исходном наборе данных класс C гораздо более распространен, чем другие классы (A = 13% случаев; B = 10% случаев; C = 77% случаев).
В порядке чтобы избежать предвзятости, я занизил выборку своего учебного набора данных. Затем я протестировал модель на реалистично распределенном наборе тестовых данных (реалистично распределенный = от 13% до 10% до 77%).
Мой отзыв очень хороший (A = 70%; B = 80%; C = 78%). Тем не менее, моя точность не (A = 44%; B = 50%; C = 95%). При прогнозировании класса А или В часто это фактически класс C.
. Я хотел бы проверить, могу ли я повысить точность классов А и В, используя другой обучающий показатель c. * 1007. *
По умолчанию каретка (XGBoost-классификация) применяет точность при создании модели. Я знаю, что функция train () имеет метрический аргумент. Но как я могу указать оценку макро-F1 в качестве значения для аргумента metri c?