Как интерпретировать индекс листьев в дереве xgboost - PullRequest
0 голосов
/ 28 октября 2019

Я получил модель xgboost после примерки. Затем я использовал model.apply () с некоторыми данными тестирования, чтобы получить индекс листа:

данные тестирования 0: индекс листа дерева 0 (например, 23), индекс дерева 1 (например, 17), ... ..

данные тестирования 1: индекс листа дерева 0 (например, 16), индекс дерева 1 (например, 22), ..... ...

Я также использовал xgboost. plot_tree для отображения дерева 0. Если max_depth of tree = 4, имеется 31 узел.

Вручную рассчитать данные тестирования 0 с деревом решений 0 и получить конечную позицию.

Кажется, трудноссылка "положение этого листа" и "индекс предыдущего листа" (например, 23).

Только описание на веб-сайте - https://xgboost.readthedocs.io/en/latest/python/python_api.html: "Для каждого элемента данных x в X и для каждого дерева вернитеиндекс листа x заканчивается. Листы нумеруются в пределах [0; 2 ** (self.max_depth + 1)), возможно, с пробелами в нумерации. "

Как интерпретировать индекс листа вxgboost tree?

...