comple_sample_weight в sklearn с пользовательскими весами - PullRequest
0 голосов
/ 24 апреля 2020

Я пытаюсь понять, как использовать compute_sample_weight Склеарна для расчета весов выборки для набора пропорций населения. Если я использую

from sklearn.utils.class_weight import compute_sample_weight
gender = [ 'F', 'F', 'F', 'F', 'F', 'F', 'F', 'F', 'M', 'M' ]
compute_sample_weight( 'balanced', gender)

, я получаю правильные веса выборки: array([0.625, 0.625, 0.625, 0.625, 0.625, 0.625, 0.625, 0.625, 2.5, 2.5]), что предполагает, что доля населения мужского пола = 0,50. Что если я захочу принять пропорцию мужчин = 0,25 в популяции и рассчитать вес выборки для каждого элемента в выборке? Я попытался

compute_sample_weight( { 'F':0.75, 'M':0.25 }, gender)

и получил

array([0.75, 0.75, 0.75, 0.75, 0.75, 0.75, 0.75, 0.75, 0.25, 0.25])

, что неверно. Женщины должны иметь вес образца 0,9375. Как я могу указать пропорции населения для расчета веса выборки? Или я использую не ту функцию?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...