Диаграмма дерева классификации от H2O Mojo / Pojo - PullRequest
0 голосов
/ 19 ноября 2018

Этот вопрос в значительной степени опирается на решение этого вопроса в качестве отправной точки.Учитывая, что я могу использовать R для создания объекта модели mojo:

library(h2o)
h2o.init()
airlinedf <- h2o.importFile("http://s3.amazonaws.com/h2o-public-test-data/smalldata/airlines/allyears2k_headers.zip")
airlinemodel <- h2o.gbm(model_id = "airlinemodel",
                training_frame = airlinedf,
                x = c("Year", "Month", "DayofMonth", "DayOfWeek", "UniqueCarrier"),
                y = "IsDepDelayed",
                max_depth = 3,
                ntrees = 5)
h2o.download_mojo(airlinemodel, getwd(), FALSE)

и bash / graphviz для создания древовидной схемы этой модели:

java -cp h2o.jar hex.genmodel.tools.PrintMojo --tree 0 -i airlinemodel.zip -o airlinemodel.gv
dot -Tpng airlinemodel.gv -o airlinemodel.png

Example GBM Tree Diagram У меня три вопроса:

  1. Как объяснить значения и решения в этой визуализации, а также значения в конечных узлах?Какие НС второго уровня?Если значения в терминальных узлах являются «вероятностями классов», как они могут быть отрицательными?

  2. Есть ли способ визуализации или концептуализации "суммарного дерева" всех деревьев в модели?

  3. Как создать диаграмму для использования цвета или формы для обозначения двоичных классификационных назначений элементов в конечном узле?

1 Ответ

0 голосов
/ 29 декабря 2018

Существует лучший способ построения деревьев решений с помощью H2O - без извлечения MOJO или выхода из R / Python - с использованием нового Tree API (начиная с 3.22.0.1). Подробные объяснения см .:

  1. Проверка деревьев решений с H2O
  2. Наконец, вы можете построить деревья решений H2O в R
...