У меня есть проблема классификации нескольких классов, для которой я пытаюсь использовать классификатор Random Forest. Цель сильно разбалансирована и имеет следующее распределение:
1 34108
4 6748
5 2458
3 132
2 37
7 11
6 6
Теперь я использую параметр "class_weight" для классификатора RandomForest, и, насколько я понимаю, веса, связанные с классами, имеют вид{class_label: weight}
Итак, правильный путь следующий:
rfc = RandomForestClassifier(n_estimators = 1000, class_weight = {1:0.784, 2: 0.00085, 3: 0.003, 4: 0.155, 5: 0.0566, 6: 0.00013, 7: 0.000252})
Спасибо за вашу помощь!