Есть ли смысл иметь bootstrap = True, когда max_sample = 1.0 в случае обучения ансамбля в мешках? - PullRequest
0 голосов
/ 02 апреля 2020

В методе объединения в мешки, если я использую n_estimator=500, max_sample=1.0 и bootstrap=True, тогда это не эквивалентно n_estimator=500 и bootstrap=False, так как в обоих случаях только одна выборка из 500 обучающих экземпляров будет быть переданным нашему предиктору? Предполагая количество обучающих экземпляров = 500.

1 Ответ

0 голосов
/ 16 апреля 2020

Нет, это не эквивалентно.

Когда вы указываете bootstrap=False, вы в основном говорите, что каждый из ваших слабых оценщиков должен обучаться с использованием каждой точки данных в вашем обучающем наборе ровно один раз.

Когда вы указываете bootstrap=True, вы рисуете с заменой, что означает, что некоторые точки данных могут использоваться более одного раза, а другие - нет. max_samples - это просто способ определить, из какой части данных вы можете bootstrap.

...