Это не будет сюрпризом, но для этого нет единой стратегии золотого гуся. По крайней мере, я никогда не сталкивался с одним из них Если вы установили один, пожалуйста, поделитесь им здесь - мне будет интересно узнать.
Существует совет в lightgbm
, который является инструментом GBM конкурента, где они говорят :
для лучшей скорости установите это количество реальных ядер ЦП, а не количество потоков (большинство ЦП используют гиперпоточность для создания 2 потоков на ядро ЦП)
Я не знаю, есть ли подобная рекомендация от авторов xgboost. Но в приближении нулевого порядка я не вижу причины, по которой две реализации будут масштабироваться по-разному.
Самый глубокий бенчмаркинг инструментов GBM, который я видел, это этот от Лоры . Он показывает, помимо прочего, масштабирование производительности как функцию количества потоков. Помните, что он действительно продвинут и выводы из него могут не применяться напрямую, если только не будут выполнены те же подготовительные действия на уровне ОС.