Случайный лес sklearn- оценка OOB - PullRequest
0 голосов
/ 09 октября 2018

В чем разница, включая oob_Score = True и не включая oob_score в RandomForestClassifier в sklearn в python.Ошибка «вне пакета» (OOB) - это средняя ошибка для каждого, рассчитанная с использованием прогнозов деревьев, которые не содержатся в соответствующем образце начальной загрузки, так как включение параметра oob_score = True влияет на вычисления средней ошибки.

1 Ответ

0 голосов
/ 10 октября 2018

Для каждого дерева только часть данных выбирается для построения дерева, т.е. обучения.Остальные образцы - это образцы из пакета.Эти образцы из пакета могут быть использованы непосредственно во время обучения для вычисления точности теста.Если вы активируете опцию, будут вычислены «oob_score_» и «oob_prediction_».

Модель обучения не изменится, если вы активируете или не включите эту опцию.Очевидно, что из-за случайной природы RF модель не будет точно такой же, если вы примените ее дважды, но она не имеет ничего общего с опцией "oob_score".К сожалению, опция scikit-learn не позволяет вам установить коэффициент OOB, то есть процент выборок, используемых для построения дерева.Это имеет место в другой библиотеке (например, C ++ Shark http://image.diku.dk/shark/sphinx_pages/build/html/rest_sources/tutorials/algorithms/rf.html).

...