Извлечь образец функций, используемых для построения каждого дерева в H2O - PullRequest
0 голосов
/ 22 февраля 2019

В модели GBM используются следующие параметры -

  • col_sample_rate
  • col_sample_rate_per_tree
  • col_sample_rate_change_per_level

Я понимаю, как осуществляется выборкаработает и сколько переменных рассматривается для разделения на каждом уровне для каждого дерева.Я пытаюсь понять, сколько раз каждая функция рассматривается для принятия решения.Есть ли способ легко извлечь всю выборку объектов, используемых для принятия решения о расщеплении, из модельного объекта?

Ссылаясь на объяснение, предоставленное H2O, http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/col_sample_rate.html, есть ли способ узнать 60 случайновыбранные функции для каждого разделения?

Спасибо за вашу помощь!

Ответы [ 2 ]

0 голосов
/ 25 февраля 2019

Если вы хотите увидеть, какие функции были использованы при заданном разбиении в заданном дереве, вы можете перемещаться по объекту H2OTree.

Для R см. Документацию здесь и здесь

Для Python см. Документацию здесь

Вы также можете взглянуть на этот Блог (если эта ссылка когда-либо умирает, просто сделайте Googleпоиск класса H2OTree)

0 голосов
/ 24 февраля 2019

Я не знаю, назову ли я это просто, но визуализатор дерева MOJO выдает файл данных graphviz dot, который превращается в визуализацию.Это информация, которая вас интересует.

http://docs.h2o.ai/h2o/latest-stable/h2o-genmodel/javadoc/overview-summary.html#viewing-a-mojo

...