Как применить балансировку данных с недостаточной дискретизацией, задав параметр? - PullRequest
0 голосов
/ 11 июля 2020

Я использую библиотеку H2O, и я хочу применить балансировку данных с недостаточной дискретизацией, установив параметр 0.8. Как я могу это сделать? Я написал эту команду:

from h2o.estimators.gbm import H2OGradientBoostingEstimator
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True)

, но balance_classes = True использует случайный параметр. Я хочу сделать этот параметр 0.8.

Буду признателен за любую помощь. Спасибо.

1 Ответ

0 голосов
/ 12 июля 2020

Вам необходимо указать еще один аргумент: class_sampling_factors. Предполагая, что существует 2 класса, и вы хотите уменьшить выборку первого класса, используйте:

cov_gbm = H2OGradientBoostingEstimator(balance_classes = True, class_sampling_factors = [0.8, 1])

class_sampling_factors должен быть списком с плавающей запятой. Каждый элемент списка определяет коэффициент выборки по классу.

...