Я использую классификатор catboost для моей бинарной модели классификации, где у меня набор данных с большим дисбалансом 0 -> 115000 & 1 -> 10000. Может кто-нибудь подсказать мне, как использовать следующие параметры в catboostclassifier:
1 . class_weights
2. scale_pos_weight?
Из документации у меня сложилось впечатление, что я могу использовать отношение суммы отрицательного класса к сумме положительного класса, то есть 115000/10000 = 11,5, в качестве входных данных для scale_pos_weight, но я не уверен.
Пожалуйста, дайте мне знать, какие точные значения использовать для этих двух параметров и метода для получения этого значения?
Спасибо