R: Обучение модели мультиклассификации по метрике макро-F1 - PullRequest
0 голосов
/ 15 апреля 2020

В настоящее время я выполняю мультиклассификацию с 3 классами результатов (A, B и C). В моем исходном наборе данных класс C гораздо более распространен, чем другие классы (A = 13% случаев; B = 10% случаев; C = 77% случаев).

В порядке чтобы избежать предвзятости, я занизил выборку своего учебного набора данных. Затем я протестировал модель на реалистично распределенном наборе тестовых данных (реалистично распределенный = от 13% до 10% до 77%).

Мой отзыв очень хороший (A = 70%; B = 80%; C = 78%). Тем не менее, моя точность не (A = 44%; B = 50%; C = 95%). При прогнозировании класса А или В часто это фактически класс C.

. Я хотел бы проверить, могу ли я повысить точность классов А и В, используя другой обучающий показатель c. * 1007. *

По умолчанию каретка (XGBoost-классификация) применяет точность при создании модели. Я знаю, что функция train () имеет метрический аргумент. Но как я могу указать оценку макро-F1 в качестве значения для аргумента metri c?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...