Я пытаюсь понять, как использовать compute_sample_weight
Склеарна для расчета весов выборки для набора пропорций населения. Если я использую
from sklearn.utils.class_weight import compute_sample_weight
gender = [ 'F', 'F', 'F', 'F', 'F', 'F', 'F', 'F', 'M', 'M' ]
compute_sample_weight( 'balanced', gender)
, я получаю правильные веса выборки: array([0.625, 0.625, 0.625, 0.625, 0.625, 0.625, 0.625, 0.625, 2.5, 2.5])
, что предполагает, что доля населения мужского пола = 0,50. Что если я захочу принять пропорцию мужчин = 0,25 в популяции и рассчитать вес выборки для каждого элемента в выборке? Я попытался
compute_sample_weight( { 'F':0.75, 'M':0.25 }, gender)
и получил
array([0.75, 0.75, 0.75, 0.75, 0.75, 0.75, 0.75, 0.75, 0.25, 0.25])
, что неверно. Женщины должны иметь вес образца 0,9375. Как я могу указать пропорции населения для расчета веса выборки? Или я использую не ту функцию?