Я делаю модель мультиклассификатора случайного леса.В основном есть сотни домашних хозяйств, которые имеют более 200 функций, и на основании этих функций я должен классифицировать их в один из классов {1,2,3,4,5,6}.
Проблема, с которой я сталкиваюсь, заключается в том, что я не могу улучшить точность модели, насколько бы я ни старался.Я использовал RandomSearchCV, а также GridSearchCV, но я могу достичь точности только около 68%.
Некоторые примечания
- Точки выборки несбалансированы.Это порядок классов в порядке убывания {1,4,2,7,6,3}.Я использовал class_weight = "сбалансированный", но это действительно повышает точность.
- Я пробовал количество оценок в диапазоне от 50-450
- Я также рассчитал оценку f1 и не только поТочность сравнения моделей
Что еще вы, ребята, предлагаете улучшить точность / f1-оценка?Я застрял с этой проблемой в течение длительного времени.Любая помощь будет высоко оценена.