Глядя на исходный код, https://github.com/dmlc/xgboost/blob/master/R-package/R/xgb.plot.multi.trees.R#L94, эта часть создает узлы в дереве:
nodes.dt <- tree.matrix[
, .(Quality = sum(Quality))
, by = .(abs.node.position, Feature)
][, .(Text = paste0(Feature[1:min(length(Feature), features_keep)],
" (",
format(Quality[1:min(length(Quality), features_keep)], digits=5),
")") %>%
paste0(collapse = "\n"))
, by = abs.node.position]
В частности, этот код записывает эти числа:
format(Quality[1:min(length(Quality), features_keep)], digits=5)
Итак, эти числа показывают качество каждого узла, что, как мне кажется, отражает, насколько правильно этот узел делит данные. Прошло много времени с тех пор, как я имел дело с этими моделями, и я никогда не был подкованным, поэтому я не могу быть уверен в своей интерпретации. Если вам нужны дополнительные объяснения значения качества, вы можете глубже изучить исходный код, чтобы выяснить, как он рассчитывается.