Случайный лес Multi Class Python не повышает точность - PullRequest
0 голосов
/ 08 октября 2018

Я делаю модель мультиклассификатора случайного леса.В основном есть сотни домашних хозяйств, которые имеют более 200 функций, и на основании этих функций я должен классифицировать их в один из классов {1,2,3,4,5,6}.

Проблема, с которой я сталкиваюсь, заключается в том, что я не могу улучшить точность модели, насколько бы я ни старался.Я использовал RandomSearchCV, а также GridSearchCV, но я могу достичь точности только около 68%.

Некоторые примечания

  1. Точки выборки несбалансированы.Это порядок классов в порядке убывания {1,4,2,7,6,3}.Я использовал class_weight = "сбалансированный", но это действительно повышает точность.
  2. Я пробовал количество оценок в диапазоне от 50-450
  3. Я также рассчитал оценку f1 и не только поТочность сравнения моделей

Что еще вы, ребята, предлагаете улучшить точность / f1-оценка?Я застрял с этой проблемой в течение длительного времени.Любая помощь будет высоко оценена.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...