Обработка мультиклассовой проблемы дисбаланса в классификации - PullRequest
0 голосов
/ 14 февраля 2020

У меня есть набор данных для обучения модели случайного леса с использованием пакета карет с несбалансированными классами (53,83,64,114,35). Чтобы справиться с этой проблемой дисбаланса, я использовал повышающую дискретизацию и понижающую выборку в пакете карет, среди которых повышающая выборка дала лучший результат. У меня вопрос, о точности прогноза класса с 35 наблюдениями. Он показывает высочайшую точность около 90%. Моя путаница заключается в том, как это может дать столько точности всего с 35 графиками (меньше информации), это из-за переоснащения, поскольку мы дублировали наблюдение с 35 до 114 при повышении частоты дискретизации? Если этот метод не оправдан, есть ли у нас какой-либо другой метод для решения этой проблемы?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...