XGBoost - Почему всегда есть ровно 100 деревьев / бустеров в модели, экспортируемых в текстовом формате с помощью dump_model? - PullRequest
0 голосов
/ 30 марта 2020

Я пытаюсь создать библиотеку облегченного вывода, используя экспортированные модели XGBoost.

В настоящее время я использую функцию dump_model API Python, которая может вывести модель в текстовый файл .

Я экспортировал две модели, одну с 10 оценками (nb_estimators=10) и другую с 400 оценками (nb_estimators=400), используя Scikit-learn API.

Независимо от количества оценщиков, оба выходных файла имеют 100 деревьев (или бустеры ) ... Это нормально? Боюсь, никто не сможет достоверно сделать вывод, используя этот тип экспортируемых моделей ...

# Every exported model has this structure:

booster[0]:
0:[f53<0.5] yes=1,no=2,missing=1
    1:[f11<7.5] yes=3,no=4,missing=3
        3:[f8<1.62607923e+09] yes=7,no=8,missing=7
            7:[f62<0.985777259] yes=15,no=16,missing=15
                 ...
booster[1]:
   ...
booster[2]:
   ...
    .
    .
    .
booster[99]:
   ...

Спасибо!

...