Как включить размеры выборки каждого узла в визуализацию дерева H2O - PullRequest
0 голосов
/ 03 июня 2019

Я работаю над визуализацией дерева регрессии с использованием H2O в Python.https://github.com/h2oai/h2o-tutorials/blob/master/tutorials/display_tree_mojo/DisplayTreeMojoH2O.ipynb

В приведенном выше примере представлен метод использования PrintMOJO.Однако выходной показатель не включает размер выборки каждого узла (и среднее значение узла).В SKLearn включены размер выборки и средние значения, но я не знаю, как интегрировать их в H2O.

Это то, что я ищу: http://www.netinstructions.com/content/images/2015/07/decision-tree-visualized.png

Есть идеи?

Я искал много ресурсов, но я не знаю, с каким параметром или переменной мне следует играть, чтобы это произошло.Если я переключусь на R, это облегчит?

1 Ответ

0 голосов
/ 09 июня 2019

Если вы предоставите параметр «—detail» для инструмента печати дерева PrintMojo, вы получите больше информации.

В частности, вы увидите вес каждого узла, который является суммой весов строккоторый перешел в узел.(Вес по умолчанию для каждой строки равен 1,0, но вы можете изменить его для каждой строки, указав столбец веса.)

Исходный код для PrintMojo находится здесь:

...