Этот вопрос в значительной степени опирается на решение этого вопроса в качестве отправной точки.Учитывая, что я могу использовать R для создания объекта модели mojo:
library(h2o)
h2o.init()
airlinedf <- h2o.importFile("http://s3.amazonaws.com/h2o-public-test-data/smalldata/airlines/allyears2k_headers.zip")
airlinemodel <- h2o.gbm(model_id = "airlinemodel",
training_frame = airlinedf,
x = c("Year", "Month", "DayofMonth", "DayOfWeek", "UniqueCarrier"),
y = "IsDepDelayed",
max_depth = 3,
ntrees = 5)
h2o.download_mojo(airlinemodel, getwd(), FALSE)
и bash / graphviz для создания древовидной схемы этой модели:
java -cp h2o.jar hex.genmodel.tools.PrintMojo --tree 0 -i airlinemodel.zip -o airlinemodel.gv
dot -Tpng airlinemodel.gv -o airlinemodel.png
У меня три вопроса:
Как объяснить значения и решения в этой визуализации, а также значения в конечных узлах?Какие НС второго уровня?Если значения в терминальных узлах являются «вероятностями классов», как они могут быть отрицательными?
Есть ли способ визуализации или концептуализации "суммарного дерева" всех деревьев в модели?
Как создать диаграмму для использования цвета или формы для обозначения двоичных классификационных назначений элементов в конечном узле?