Правильное использование параметра "class_weight" в классификаторе Random Forest - PullRequest
0 голосов
/ 07 октября 2019

У меня есть проблема классификации нескольких классов, для которой я пытаюсь использовать классификатор Random Forest. Цель сильно разбалансирована и имеет следующее распределение:

1    34108

4     6748

5     2458

3      132

2       37

7       11

6        6

Теперь я использую параметр "class_weight" для классификатора RandomForest, и, насколько я понимаю, веса, связанные с классами, имеют вид{class_label: weight}

Итак, правильный путь следующий:

rfc = RandomForestClassifier(n_estimators = 1000, class_weight = {1:0.784, 2: 0.00085, 3: 0.003, 4: 0.155, 5: 0.0566, 6: 0.00013, 7: 0.000252})

Спасибо за вашу помощь!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...