Почему scikit-learn умножает class_weight на num_classes - PullRequest
0 голосов
/ 16 июня 2020

Имеет ли значение для keras (или scikit-learn), если наш class_weight словарь, используемый в .fit() для моделей keras и при объявлении моделей scikit-learn, имеет веса, которые имеют одинаковое соотношение между классами, но в большие масштабы?

Пример:


num_samples = 100
num_classes = 2
class_a_samples = 80
class_b_samples = 20

# Do we prefer this?
weight_class_a = num_samples / (num_classes * class_a_samples) # 0.625
weight_class_b = num_samples / (num_classes * class_b_samples) # 2.5

# Or this?
weight_class_a = num_samples / class_a_samples # 1,25
weight_class_b = num_samples / class_b_samples # 5

Я знаю, что scikit-learn использует первый подход, но я не могу понять, зачем умножать на num_classes (по крайней мере, когда num_classes = 2 )

...