Имеет ли значение для keras (или scikit-learn), если наш class_weight
словарь, используемый в .fit()
для моделей keras и при объявлении моделей scikit-learn, имеет веса, которые имеют одинаковое соотношение между классами, но в большие масштабы?
Пример:
num_samples = 100
num_classes = 2
class_a_samples = 80
class_b_samples = 20
# Do we prefer this?
weight_class_a = num_samples / (num_classes * class_a_samples) # 0.625
weight_class_b = num_samples / (num_classes * class_b_samples) # 2.5
# Or this?
weight_class_a = num_samples / class_a_samples # 1,25
weight_class_b = num_samples / class_b_samples # 5
Я знаю, что scikit-learn использует первый подход, но я не могу понять, зачем умножать на num_classes
(по крайней мере, когда num_classes
= 2 )