Значение прогноза в дереве выборки, сделанном случайным лесом H2O - PullRequest
0 голосов
/ 26 марта 2019

В настоящее время я создаю случайный лес по пакету H2O и построил пример дерева для демонстрации. Значение прогнозирования каждого узла не совсем совпадает с вероятностью положительного класса во всех экземплярах узла.

Просто интересно узнать, как H2O рассчитывает значение прогноза. Мне нужна формула, чтобы получить этот прогноз! Я знаю, что случайный лес превосходит средний прогноз деревьев. Но как рассчитывается этот прогноз на каждом узле каждого дерева?

Любая помощь будет оценена.

Ответы [ 2 ]

0 голосов
/ 28 марта 2019

Я нашел решение, которое возвращает точный коэффициент вероятности данных поезда, заданный в качестве значения прогноза в дереве выборок. вам просто нужно установить свой код следующим образом: h2o.randomforest(sample_rate = 1, calibrate_model = TRUE, and calibration_frame = train )

0 голосов
/ 26 марта 2019

См. Алгоритм 15.1 из элементов статистического обучения:

А затем посмотрите код для реализации модели учебного процесса в H2O-3:

Наконец, лучший способ понять, как фактическая сгенерированная модель используется для создания результатов, - это реализация genmodel MOJO, которую вы можете найти здесь (попробуйте использовать отладчик java для пошагового выполнения вызова метода Score0 ()):

...